Дата публикации
ai_products

Claude Opus 4.6, Gemini 3.1 Pro и ChatGPT‑5.4: что реально умеют топовые LLM

Нейросети снова обновились, но не равномерно. GPT‑5.4, Claude Opus 4.6 и Gemini 3.1 Pro двигаются в одну сторону — к длинному контексту и сложным цепочкам задач, — но делают упор на разное.

Что появилось / что изменилось

GPT‑5.4

  • Контекстное окно: до 1 000 000 токенов.
  • Может искать информацию в интернете и склеивать ответы из множества источников.
  • Поддерживает агентный режим: управление браузером, действия мышью и клавиатурой, вызов API и внешних инструментов.
  • Улучшены базовые навыки работы с текстом и кодом.

Claude Opus 4.6

  • Контекст: до 1 500 000 токенов — это больше, чем у GPT‑5.4.
  • Ускорена обработка запросов и переработана логика ответа.
  • Появилось внутреннее планирование: модель строит карту рассуждений до генерации текста.
  • Ориентир на промышленные сценарии: работа с целыми модулями кода и крупными проектами.

Gemini 3.1 Pro

  • Контекст: 1 000 000 токенов на входе и до 64 000 токенов на выходе.
  • Встроено «глубокое мышление» — модель параллельно рассматривает несколько путей решения и выбирает лучший.
  • Оптимизация под программирование и агентные рабочие процессы с цепочками задач.
  • Google позиционирует Gemini 3.1 Pro как свою самую интеллектуальную модель для сложных задач.

Как это работает

GPT‑5.4 OpenAI не просто нарастила контекст, а связала LLM с инструментами. Модель анализирует скриншоты, ходит в браузер, дергает API. По сути это уже не только генератор текста, а движок, который может управлять окружением через дополнительное ПО. Поиск по сети встроен в сценарий ответа: GPT‑5.4 подтягивает данные, а затем объединяет их в цельный разбор.

Claude Opus 4.6 Anthropic добавила внутреннее планирование. Opus 4.6 сначала строит черновой маршрут рассуждений, проверяет этапы внутри себя, а уже потом выдает финальный текст. Это снижает шанс логических провалов на длинных цепочках. 1,5 млн токенов позволяют загружать в промышленных задачах не отдельные файлы, а почти всю кодовую базу небольшого проекта и работать с ней как с целым.

Gemini 3.1 Pro Google DeepMind перенесла режим глубокого мышления в базу модели. Gemini 3.1 Pro тратит больше вычислений на шаг «подумать», а не только «написать». Модель параллельно разворачивает несколько гипотез решения и выбирает оптимальную. Это важно для сложного кода, аналитики и многошаговых задач. Большой выход в 64 000 токенов позволяет генерировать длинные отчеты, повести или крупные блоки кода за один прогон.

Что это значит для вас

Когда выбирать GPT‑5.4

  • Подходит, если вы хотите не только текст, но и действия: запуск скриптов, работа через браузер, интеграции с API.
  • Удобен для ресерча: собрать информацию с множества источников, свести в один разбор или конспект.
  • Сценарии: агентные ассистенты, инструменты для автоматизации рутины, прототипы «цифровых сотрудников».
  • Минус: зависимость от экосистемы OpenAI и инфраструктуры вокруг нее; доступ может требовать VPN и зарубежного аккаунта.

Когда выбирать Claude Opus 4.6

  • Если вы тащите в модель огромные объемы текста или кода. 1,5 млн токенов — это редкая возможность держать в памяти почти весь небольшой проект.
  • Хорош для задач, где важна последовательность логики: сложная документация, архитектура ПО, многошаговые рассуждения.
  • Сценарии: аудит и рефакторинг крупных кодовых баз, разбор длинных юридических или технических документов, аналитика с большим контекстом.
  • Минус: модель заточена под качество и глубину, а не под массовую доступность; для пользователей из России доступ часто идет через агрегаторы и может требовать VPN.

Когда выбирать Gemini 3.1 Pro

  • Если вам важна связка с продуктами Google и фокус на программировании и аналитике.
  • Сильная сторона — длинные ответы: отчеты, документы, большие куски кода, стратегии, лонгриды.
  • Сценарии: системный анализ, сложные цепочки задач для агента, многоступенчатые вычислительные или исследовательские запросы.
  • Минус: ограничения по доступу в России, привязка к политике Google, возможная необходимость VPN и обходных путей оплаты.

Общий ориентир: для агентных сценариев и экспериментов с автоматизацией — GPT‑5.4; для глубокой работы с длинным контекстом и логикой — Claude Opus 4.6; для комплексного «подумать и расписать на много страниц» — Gemini 3.1 Pro.

Место на рынке

По контексту лидирует Claude Opus 4.6 с 1,5 млн токенов. GPT‑5.4 и Gemini 3.1 Pro отстают с 1 млн токенов, но у Gemini больше максимальный размер ответа — до 64 тыс. токенов.

По агентным возможностям сейчас наиболее продвинут GPT‑5.4: управление браузером, действия мышью и клавиатурой, вызов API. Gemini 3.1 Pro тоже идет в сторону агентных сценариев, но без открытых подробностей про конкретный набор действий. Opus 4.6 делает ставку не на внешний контроль, а на устойчивую работу внутри сложных задач.

По разработке ПО Opus 4.6 и Gemini 3.1 Pro целятся в близкий сегмент. Opus берет объемом контекста и возможностью держать в голове весь проект. Gemini делает упор на глубокое мышление и длинную генерацию кода или документации. GPT‑5.4 выглядит как более универсальный инструмент: код, текст и действия вокруг них.

По доступности для пользователей из России проще всего работать через агрегаторы вроде BotHub, где собраны все три направления — текст, код, транскрибация, видео. Прямой доступ к сервисам OpenAI, Anthropic и Google часто требует VPN и зарубежного способа оплаты, так что для быстрой проверки гипотез удобнее использовать сторонние площадки.


Читайте также

Claude Opus 4.6, Gemini 3.1 Pro и ChatGPT‑5.4: что реально умеют топовые LLM — VogueTech | VogueTech