- Дата публикации
Claude Opus 4.6, Gemini 3.1 Pro и ChatGPT‑5.4: что реально умеют топовые LLM
Нейросети снова обновились, но не равномерно. GPT‑5.4, Claude Opus 4.6 и Gemini 3.1 Pro двигаются в одну сторону — к длинному контексту и сложным цепочкам задач, — но делают упор на разное.
Что появилось / что изменилось
GPT‑5.4
- Контекстное окно: до 1 000 000 токенов.
- Может искать информацию в интернете и склеивать ответы из множества источников.
- Поддерживает агентный режим: управление браузером, действия мышью и клавиатурой, вызов API и внешних инструментов.
- Улучшены базовые навыки работы с текстом и кодом.
Claude Opus 4.6
- Контекст: до 1 500 000 токенов — это больше, чем у GPT‑5.4.
- Ускорена обработка запросов и переработана логика ответа.
- Появилось внутреннее планирование: модель строит карту рассуждений до генерации текста.
- Ориентир на промышленные сценарии: работа с целыми модулями кода и крупными проектами.
Gemini 3.1 Pro
- Контекст: 1 000 000 токенов на входе и до 64 000 токенов на выходе.
- Встроено «глубокое мышление» — модель параллельно рассматривает несколько путей решения и выбирает лучший.
- Оптимизация под программирование и агентные рабочие процессы с цепочками задач.
- Google позиционирует Gemini 3.1 Pro как свою самую интеллектуальную модель для сложных задач.
Как это работает
GPT‑5.4 OpenAI не просто нарастила контекст, а связала LLM с инструментами. Модель анализирует скриншоты, ходит в браузер, дергает API. По сути это уже не только генератор текста, а движок, который может управлять окружением через дополнительное ПО. Поиск по сети встроен в сценарий ответа: GPT‑5.4 подтягивает данные, а затем объединяет их в цельный разбор.
Claude Opus 4.6 Anthropic добавила внутреннее планирование. Opus 4.6 сначала строит черновой маршрут рассуждений, проверяет этапы внутри себя, а уже потом выдает финальный текст. Это снижает шанс логических провалов на длинных цепочках. 1,5 млн токенов позволяют загружать в промышленных задачах не отдельные файлы, а почти всю кодовую базу небольшого проекта и работать с ней как с целым.
Gemini 3.1 Pro Google DeepMind перенесла режим глубокого мышления в базу модели. Gemini 3.1 Pro тратит больше вычислений на шаг «подумать», а не только «написать». Модель параллельно разворачивает несколько гипотез решения и выбирает оптимальную. Это важно для сложного кода, аналитики и многошаговых задач. Большой выход в 64 000 токенов позволяет генерировать длинные отчеты, повести или крупные блоки кода за один прогон.
Что это значит для вас
Когда выбирать GPT‑5.4
- Подходит, если вы хотите не только текст, но и действия: запуск скриптов, работа через браузер, интеграции с API.
- Удобен для ресерча: собрать информацию с множества источников, свести в один разбор или конспект.
- Сценарии: агентные ассистенты, инструменты для автоматизации рутины, прототипы «цифровых сотрудников».
- Минус: зависимость от экосистемы OpenAI и инфраструктуры вокруг нее; доступ может требовать VPN и зарубежного аккаунта.
Когда выбирать Claude Opus 4.6
- Если вы тащите в модель огромные объемы текста или кода. 1,5 млн токенов — это редкая возможность держать в памяти почти весь небольшой проект.
- Хорош для задач, где важна последовательность логики: сложная документация, архитектура ПО, многошаговые рассуждения.
- Сценарии: аудит и рефакторинг крупных кодовых баз, разбор длинных юридических или технических документов, аналитика с большим контекстом.
- Минус: модель заточена под качество и глубину, а не под массовую доступность; для пользователей из России доступ часто идет через агрегаторы и может требовать VPN.
Когда выбирать Gemini 3.1 Pro
- Если вам важна связка с продуктами Google и фокус на программировании и аналитике.
- Сильная сторона — длинные ответы: отчеты, документы, большие куски кода, стратегии, лонгриды.
- Сценарии: системный анализ, сложные цепочки задач для агента, многоступенчатые вычислительные или исследовательские запросы.
- Минус: ограничения по доступу в России, привязка к политике Google, возможная необходимость VPN и обходных путей оплаты.
Общий ориентир: для агентных сценариев и экспериментов с автоматизацией — GPT‑5.4; для глубокой работы с длинным контекстом и логикой — Claude Opus 4.6; для комплексного «подумать и расписать на много страниц» — Gemini 3.1 Pro.
Место на рынке
По контексту лидирует Claude Opus 4.6 с 1,5 млн токенов. GPT‑5.4 и Gemini 3.1 Pro отстают с 1 млн токенов, но у Gemini больше максимальный размер ответа — до 64 тыс. токенов.
По агентным возможностям сейчас наиболее продвинут GPT‑5.4: управление браузером, действия мышью и клавиатурой, вызов API. Gemini 3.1 Pro тоже идет в сторону агентных сценариев, но без открытых подробностей про конкретный набор действий. Opus 4.6 делает ставку не на внешний контроль, а на устойчивую работу внутри сложных задач.
По разработке ПО Opus 4.6 и Gemini 3.1 Pro целятся в близкий сегмент. Opus берет объемом контекста и возможностью держать в голове весь проект. Gemini делает упор на глубокое мышление и длинную генерацию кода или документации. GPT‑5.4 выглядит как более универсальный инструмент: код, текст и действия вокруг них.
По доступности для пользователей из России проще всего работать через агрегаторы вроде BotHub, где собраны все три направления — текст, код, транскрибация, видео. Прямой доступ к сервисам OpenAI, Anthropic и Google часто требует VPN и зарубежного способа оплаты, так что для быстрой проверки гипотез удобнее использовать сторонние площадки.