В марте 2026 года произошло то, чего ждали давно. OpenAI, Anthropic, Google и DeepSeek выпустили флагманские модели почти одновременно. Теперь у пользователя четыре реальных варианта — и ни один не выигрывает по всем параметрам сразу.
Что вышло в марте
GPT-5.4 вышел 5 марта. Контекстное окно — 1 миллион токенов. На тесте GDPVal (реальные экономически значимые задачи) набрал 83% — это уровень человека-эксперта.
Claude Opus 4.6 от Anthropic — сильнейшая модель для кода среди коммерческих. Интересно, что на бенчмарке GDPval-AA Elo лидирует не Opus, а Sonnet 4.6 — 1633 очка, выше и Opus, и Gemini 3.1 Pro.
Gemini 3.1 Pro: 80.6% на SWE-bench, 94.3% на GPQA Diamond. Контекст — 1 миллион токенов.
DeepSeek V4 работает на триллионе параметров, из которых активны 32 миллиарда (архитектура mixture-of-experts). На тесте Needle-in-Haystack при миллионном контексте — 97% точности. Цена: $0.28 за миллион входящих токенов. Все конкуренты стоят в разы дороже.
Российские модели
GigaChat от Сбера работает на 20 миллиардах параметров. Это уровень ChatGPT 3.5 образца двух лет назад. Контекст — 131 тысяча токенов.
YandexGPT интегрирован в экосистему Яндекса — Алису, 360, браузер. Для задач внутри этой экосистемы удобен.
Обе российские модели работают без VPN и принимают российские карты. Иностранные — только с VPN и иностранной картой.
Как выбрать
Для текста и сложных рассуждений — GPT-5.4 или Claude Opus 4.6. Для кода — Claude. Для дешёвых API-запросов — DeepSeek V4. Для работы без VPN — GigaChat или YandexGPT.
Нет одного правильного ответа. Всё зависит от задачи, бюджета и того, готовы ли вы разбираться с VPN.