Почему российские языковые модели отстают от мировых лидеров — и когда мы всех обгоним?

Пока в мире ИИ гонка только набирает обороты, всё чаще возникает неудобный вопрос: а где в этом забеге российские языковые модели?
Чтобы разобраться, начнём с простого: кто сейчас на вершине?
Кто в топе глобальных LLM?
По данным LLM Stats, мировой рейтинг возглавляют:
- Claude 3.7 Sonnet — Anthropic (США)
- Grok-3 и Grok-3 Mini — xAI (США)
- Gemini 2.5 Pro — Google (США)
- o3 — OpenAI (США)
Также в топ-20 уверенно входят:
- DeepSeek-R1
- Llama 4 Maverick
- Qwen3 30B A3B
А что на родине?
Если заглянуть в LLM Arena — платформу, где сравниваются модели с поддержкой русского языка, — то здесь ситуация говорит сама за себя:
- GPT-4o (2024-11-20) — OpenAI
- Gemini Pro 1.5 — Google
- Claude 3.5 Sonnet (2024-10-22) — Anthropic
- Gemma 3 27B — Google
- DeepSeek R1 — DeepSeek
И только на 19-м месте — GigaChat-Max-preview от Сбера. Где-то ещё ниже — YandexGPT.
Вывод очевиден: российские модели не входят даже в ближний круг лидеров, несмотря на то, что русский язык уверенно поддерживается почти всеми топ-LLM.
Может, просто позже начали?
Это логичное объяснение. Мол, "они начали раньше, вот и оторвались".
Давайте посмотрим на даты запуска:
- GPT (OpenAI) - Первая модель вышла в 2018 году
- Claude (Anthropic) - Первая модель вышла в 2023 году
- Gemini (Google) - Первая модель вышла в 2023 году
- Grok (xAI) - Первая модель вышла в 2023 году
- Llama - Первая модель вышла в 2023 году
- DeepSeek (DeepSeek) - Первая модель вышла в 2024 году
- Qwen (Alibaba) - Первая модель вышла в 2024 году
- GigaChat (Сбер) - Первая модель вышла в 2023 году
- YandexGPT (Яндекс) - Первая модель вышла в 2023 году
Как видим, почти все запустились примерно в одно время — в 2023 году. Так что дело явно не во времени.
Так в чём тогда дело?
Хороший продукт требует двух вещей: времени и денег. Со временем — всё ок. Значит, смотрим на второе.
И вот тут начинается самое интересное.
Кому наливают миллиарды?
xAI — Илон Маск на максималках
В 2024 году xAI привлекла $6 миллиардов инвестиций. Это только один раунд, в котором участвовали 97 инвесторов, каждый вложивший минимум $77,593.
По данным WSJ, среди них были Valor Equity Partners, Sequoia Capital, Andreessen Horowitz и Суверенный фонд Катара.
С учётом предыдущих раундов, общий объём инвестиций в xAI — $12 миллиардов.
Компания стремится к оценке в $50 млрд — в два раза больше, чем полгода назад.
Anthropic — с Google и Amazon под крылом
Разработчик Claude — Anthropic — в последнем раунде серии E привлёк $3,5 млрд.
Оценка компании достигла $61,5 млрд.
Если прибавить инвестиции от Google ($3 млрд) и Amazon ($8 млрд), общая сумма — $14,5 миллиардов.
Важно: это не просто деньги, а стратегические соглашения. Anthropic обязана использовать инфраструктуру инвесторов для обучения моделей, а облачные гиганты — получают трафик и рост выручки.
OpenAI — левел бог по инвестициям
Лидер индустрии привлёк более $63 миллиардов. Только в марте 2025 года — $40 млрд в раунде F.
Вот краткий обзор крупных раундов:
- Март 2025 - $40 млрд - Ключевые инвесторы: Microsoft, SoftBank, Coatue и др.
- Октябрь 2024 - $6.6 млрд - Ключевые инвесторы: Microsoft, NVIDIA, SoftBank
- Январь 2023 - $10 млрд - Ключевые инвесторы: Microsoft
- Апрель 2023 - $300 млн - Ключевые инвесторы: Sequoia, Tiger Global и др.
- 2019 - $1 млрд - Ключевые инвесторы: Microsoft
- 2015 - $1 млрд - Ключевые инвесторы: Маск, Тиль, YC и др.
Это огромный объём ресурсов, стратегических партнёрств и инфраструктурных возможностей.
А что у нас?
Теперь немного о грустном.
В 2023 году Сбер анонсировал инвестиции в AI и IT-инфраструктуру — 450 млрд рублей до 2026 года, или около $4,2 млрд.
Яндекс — более скромно: $0,9 млрд (или 10 млрд рублей) на развитие генеративных моделей в 2023 году.
На фоне xAI, Anthropic и OpenAI — это капля в море.
А если захотят вложить больше?
Давайте посмотрим на ресурсы:
Чистая прибыль Сбера за 2024 год — 1,5 трлн рублей
У Яндекса — около 100 млрд рублей
Но тут важные нюансы:
У Сбера — десятки направлений: банк, страхование, экосистема, облачные сервисы
Дивиденды: 750 млрд рублей (50% прибыли) компания отдаёт акционерам
У Яндекса — тоже мультибизнес с большими потребностями в развитии
Даже если захотят вложить по-крупному, столько, сколько вкидывают в OpenAI или xAI — они просто не могут.
Может, государство должно вмешаться?
Генеративные нейросети — нефть 21 века. Кто оседлает волну — тот и будет на вершине.
Если рассматривать это как стратегический актив, государственная поддержка логична.
Но даже тут есть нюанс.
А окупится ли это?
Глобальные компании создают LLM для всего мира — у них миллиарды пользователей. А у России — в основном внутренний рынок. Из-за политических ограничений выход на развитые рынки практически закрыт.
Чтобы выйти на глобальный уровень, нужна технологическая революция — решение, которое будет на голову выше всех аналогов.
VPN? Да, можно. Но массово никто не будет подключаться к российской LLM, если она не будет выдающейся.
Финал этой гонки ещё впереди
Мы следим за этой гонкой широко открыв глаза. Потому что это только начало — и ставки здесь выше, чем когда-либо.
Опубликовано: 20 мая 2025 г.