Почему российские языковые модели отстают от мировых лидеров — и когда мы всех обгоним?

Почему российские языковые модели отстают от мировых лидеров — и когда мы всех обгоним?
Пока в мире ИИ гонка только набирает обороты, всё чаще возникает неудобный вопрос: а где в этом забеге российские языковые модели?

Чтобы разобраться, начнём с простого: кто сейчас на вершине?

Кто в топе глобальных LLM?

По данным LLM Stats, мировой рейтинг возглавляют:

  • Claude 3.7 Sonnet — Anthropic (США)
  • Grok-3 и Grok-3 Mini — xAI (США)
  • Gemini 2.5 Pro — Google (США)
  • o3 — OpenAI (США)

Также в топ-20 уверенно входят:

  • DeepSeek-R1
  • Llama 4 Maverick
  • Qwen3 30B A3B

А что на родине?

Если заглянуть в LLM Arena — платформу, где сравниваются модели с поддержкой русского языка, — то здесь ситуация говорит сама за себя:

  • GPT-4o (2024-11-20) — OpenAI
  • Gemini Pro 1.5 — Google
  • Claude 3.5 Sonnet (2024-10-22) — Anthropic
  • Gemma 3 27B — Google
  • DeepSeek R1 — DeepSeek
И только на 19-м месте — GigaChat-Max-preview от Сбера. Где-то ещё ниже — YandexGPT.
Вывод очевиден: российские модели не входят даже в ближний круг лидеров, несмотря на то, что русский язык уверенно поддерживается почти всеми топ-LLM.

Может, просто позже начали?

Это логичное объяснение. Мол, "они начали раньше, вот и оторвались".

Давайте посмотрим на даты запуска:

  • GPT (OpenAI) - Первая модель вышла в 2018 году
  • Claude (Anthropic) - Первая модель вышла в 2023 году
  • Gemini (Google) - Первая модель вышла в 2023 году
  • Grok (xAI) - Первая модель вышла в 2023 году
  • Llama - Первая модель вышла в 2023 году
  • DeepSeek (DeepSeek) - Первая модель вышла в 2024 году
  • Qwen (Alibaba) - Первая модель вышла в 2024 году
  • GigaChat (Сбер) - Первая модель вышла в 2023 году
  • YandexGPT (Яндекс) - Первая модель вышла в 2023 году
Как видим, почти все запустились примерно в одно время — в 2023 году. Так что дело явно не во времени.

Так в чём тогда дело?

Хороший продукт требует двух вещей: времени и денег. Со временем — всё ок. Значит, смотрим на второе.

И вот тут начинается самое интересное.

Кому наливают миллиарды?

xAI — Илон Маск на максималках

В 2024 году xAI привлекла $6 миллиардов инвестиций. Это только один раунд, в котором участвовали 97 инвесторов, каждый вложивший минимум $77,593.

По данным WSJ, среди них были Valor Equity Partners, Sequoia Capital, Andreessen Horowitz и Суверенный фонд Катара.

С учётом предыдущих раундов, общий объём инвестиций в xAI — $12 миллиардов.

Компания стремится к оценке в $50 млрд — в два раза больше, чем полгода назад.

Anthropic — с Google и Amazon под крылом

Разработчик Claude — Anthropic — в последнем раунде серии E привлёк $3,5 млрд.

Оценка компании достигла $61,5 млрд.

Если прибавить инвестиции от Google ($3 млрд) и Amazon ($8 млрд), общая сумма — $14,5 миллиардов.

Важно: это не просто деньги, а стратегические соглашения. Anthropic обязана использовать инфраструктуру инвесторов для обучения моделей, а облачные гиганты — получают трафик и рост выручки.

OpenAI — левел бог по инвестициям

Лидер индустрии привлёк более $63 миллиардов. Только в марте 2025 года — $40 млрд в раунде F.

Вот краткий обзор крупных раундов:

  • Март 2025 - $40 млрд - Ключевые инвесторы: Microsoft, SoftBank, Coatue и др.
  • Октябрь 2024 - $6.6 млрд - Ключевые инвесторы: Microsoft, NVIDIA, SoftBank
  • Январь 2023 - $10 млрд - Ключевые инвесторы: Microsoft
  • Апрель 2023 - $300 млн - Ключевые инвесторы: Sequoia, Tiger Global и др.
  • 2019 - $1 млрд - Ключевые инвесторы: Microsoft
  • 2015 - $1 млрд - Ключевые инвесторы: Маск, Тиль, YC и др.

Это огромный объём ресурсов, стратегических партнёрств и инфраструктурных возможностей.

А что у нас?

Теперь немного о грустном.

В 2023 году Сбер анонсировал инвестиции в AI и IT-инфраструктуру — 450 млрд рублей до 2026 года, или около $4,2 млрд.

Яндекс — более скромно: $0,9 млрд (или 10 млрд рублей) на развитие генеративных моделей в 2023 году.

На фоне xAI, Anthropic и OpenAI — это капля в море.

А если захотят вложить больше?

Давайте посмотрим на ресурсы:

Чистая прибыль Сбера за 2024 год — 1,5 трлн рублей

У Яндекса — около 100 млрд рублей

Но тут важные нюансы:

У Сбера — десятки направлений: банк, страхование, экосистема, облачные сервисы

Дивиденды: 750 млрд рублей (50% прибыли) компания отдаёт акционерам

У Яндекса — тоже мультибизнес с большими потребностями в развитии

Даже если захотят вложить по-крупному, столько, сколько вкидывают в OpenAI или xAI — они просто не могут.

Может, государство должно вмешаться?

Генеративные нейросети — нефть 21 века. Кто оседлает волну — тот и будет на вершине.

Если рассматривать это как стратегический актив, государственная поддержка логична.

Но даже тут есть нюанс.

А окупится ли это?

Глобальные компании создают LLM для всего мира — у них миллиарды пользователей. А у России — в основном внутренний рынок. Из-за политических ограничений выход на развитые рынки практически закрыт.

Чтобы выйти на глобальный уровень, нужна технологическая революция — решение, которое будет на голову выше всех аналогов.

VPN? Да, можно. Но массово никто не будет подключаться к российской LLM, если она не будет выдающейся.

Финал этой гонки ещё впереди

Мы следим за этой гонкой широко открыв глаза. Потому что это только начало — и ставки здесь выше, чем когда-либо.

Опубликовано: 20 мая 2025 г.