Дата публикации
ai_products

OpenAI показала GPT-5.6 Sol, Terra и Luna: цены, мощности и кому это вообще нужно

Что нового

OpenAI представила новое семейство языковых моделей GPT-5.6 из трёх уровней:

  • GPT-5.6 Sol — флагман для самых сложных задач.
  • GPT-5.6 Terra — золотая середина по мощности и цене.
  • GPT-5.6 Luna — бюджетный вариант.

Пока доступ есть только у ограниченного круга «доверенных партнёров» через API и Codex. В ближайшие недели OpenAI обещает открыть более широкий доступ, включая интеграцию в ChatGPT.

Новая схема названий

OpenAI перестроила систему именования:

  • «5.6» — поколение модели.
  • Sol, Terra, Luna — постоянные названия уровней производительности.
  • Линейки Sol / Terra / Luna будут развиваться отдельно, а не как один монолитный продукт.

Производительность по бенчмаркам

OpenAI приводит результаты внутренних тестов, в том числе TerminalBench 2.1 — это бенчмарк сложных задач в командной строке:

  • GPT-5.6 Sol Ultra91,9%.
  • GPT-5.6 Sol (обычный режим)88,8%.
  • GPT-5.6 Terra84,3%.
  • GPT-5.6 Luna82,5%.

В биологических задачах (бенчмарк GeneBench v1):

  • Sol превосходит GPT-5.5 по качеству результатов.
  • При этом тратит меньше токенов на те же задачи.

OpenAI также называет Sol самой сильной моделью компании в кибербезопасности.

Цены

Стоимость через API отличается довольно сильно:

  • GPT-5.6 Sol$5 за 1 млн входных токенов и $30 за 1 млн выходных.
  • GPT-5.6 Terra$2,5 за 1 млн входных и $15 за 1 млн выходных.
  • GPT-5.6 Luna$1 за 1 млн входных и $6 за 1 млн выходных.

Для сравнения внутри линейки: Sol примерно в 5 раз дороже Luna по выходным токенам.

Режимы Max и Ultra для Sol

У Sol есть два дополнительных режима:

  • Max — даёт модели больше времени на рассуждения при сложных задачах.
  • Ultra — запускает несколько субагентов, которые параллельно решают части задачи и ускоряют сложные рабочие процессы.

Кэширование запросов в API

OpenAI доработала кэш в API для GPT-5.6:

  • Появились явные точки сброса кэша (cache breakpoints) — разработчик может управлять, где кэш обнуляется.
  • Минимальное время хранения кэшированных запросов увеличено до 30 минут.

Это снижает стоимость и ускоряет повторяющиеся запросы, особенно в больших пайплайнах.

Безопасность и тестирование

OpenAI делает серьёзный акцент на безопасном поведении GPT-5.6:

  • GPT-5.6 получила «самый надёжный стек защитных механизмов» в истории OpenAI.
  • Sol обучили жёстко отказываться от запроса помощи в кибератаках — даже если пользователь скрывает намерения, пытается обмануть или использовать джейлбрейки.
  • Sol лучше находит и исправляет уязвимости, чем помогает проводить полноценные атаки.

Масштаб тестирования:

  • На автоматизированное тестирование защиты ушло более 700 000 GPU-часов на акселераторах уровня NVIDIA A100.
  • В тестировании участвовали независимые специалисты по безопасности, и они продолжат проверки на протяжении всего периода предварительного доступа.

Во время ограниченного тестирования OpenAI включает усиленные фильтры:

  • Некоторые легитимные запросы, особенно по исследованиям в области информационной безопасности, могут временно блокироваться или отправляться на дополнительную проверку.
  • Обратная связь от таких кейсов нужна OpenAI, чтобы настроить защиту перед массовым запуском.

Политический контекст запуска

Релиз GPT-5.6 произошёл менее чем через сутки после сообщений СМИ о том, что OpenAI отложит запуск по просьбе администрации президента США Дональда Трампа.

Во время предварительного тестирования:

  • Доступ к модели получит ограниченный круг организаций.
  • Этот список согласован с властями США.

OpenAI говорит, что не считает такую процедуру нормой. Компания заявляет, что сотрудничала с правительством США перед запуском GPT-5.6, но рассчитывает, что в будущем новые модели будут запускаться без предварительного государственного согласования.

Как это работает

OpenAI не раскрывает архитектуру GPT-5.6, но по описанию можно сделать несколько выводов о том, что происходит под капотом.

Семейство из трёх уровней

Sol, Terra и Luna — это не просто разные «тарифы», а три независимые ветки развития:

  • Sol — максимум параметров, сложные цепочки рассуждений, длинные агентные сценарии.
  • Terra — баланс между стоимостью и качеством кода, безопасности и научных задач.
  • Luna — оптимизация под цену и массовые сценарии, где важнее объём, чем пик качества.

Агентные сценарии и субагенты

Sol специально настраивали под длительные агентные сценарии:

  • Модель умеет планировать последовательность шагов и выполнять их по очереди.
  • В режиме Ultra Sol использует несколько субагентов. Каждый отвечает за свою часть задачи или этап пайплайна.
  • Это особенно полезно для сложных рабочих процессов: CI/CD, анализ логов, автоматизация инфраструктуры.

Max: больше времени на размышления

Режим Max для Sol — это по сути более «долго думающий» режим:

  • Модели дают больше вычислительных ресурсов на один запрос.
  • Она может строить более длинные цепочки рассуждений.
  • Это нужно для задач, где ошибка дорого стоит: безопасность, биоинформатика, сложная архитектура ПО.

Кэширование и cache breakpoints

Кэш в API GPT-5.6 работает как слой сохранения промежуточных шагов:

  • Если ваш запрос повторяет большую часть предыдущего, модель может использовать сохранённые промежуточные вычисления.
  • Cache breakpoints позволяют явно сказать: «Вот здесь начинается новая логика, старый кэш больше не подходит».
  • Минимальное время хранения кэшированных запросов — 30 минут, что полезно для интерактивных сессий, IDE, агентных систем.

Безопасность под нагрузкой

Масштаб тестирования (700 тыс. GPU-часов) говорит о том, что OpenAI:

  • Массово прогоняла GPT-5.6 через сценарии джейлбрейков и попыток обхода ограничений.
  • Отдельно учила модель распознавать завуалированные попытки кибератак.
  • Балансирует между полезными задачами по безопасности (поиск уязвимостей) и блокировкой вредоносных сценариев.

Что это значит для вас

Разработчики и инженеры

Когда имеет смысл смотреть на GPT-5.6 Sol:

  • Вам нужны сложные цепочки действий: DevOps-агенты, автоматизация инфраструктуры, сложные пайплайны данных.
  • Вы работаете с кибербезопасностью: аудит кода, поиск уязвимостей, анализ конфигураций.
  • Вы занимаетесь биологией и биоинформатикой: анализ последовательностей, гипотезы по экспериментам, работа с научными текстами.
  • Бюджет позволяет жить с ценами $5 / $30 за миллион токенов.

Когда логичнее взять Terra:

  • Вам нужен баланс цены и качества.
  • Задачи — обычная разработка, документация, аналитика, бизнес-отчёты.
  • Вы хотите использовать GPT-5.6 в продуктах с большим трафиком, но Sol получается слишком дорогой.

Когда подойдёт Luna:

  • Нужен массовый сервис: чат-поддержка, генерация описаний, внутренняя автоматизация.
  • Важнее стоимость, чем максимальное качество.
  • Цена $1 / $6 за миллион токенов делает Luna интересной для стартапов и внутренних корпоративных инструментов.

Исследователи безопасности

Плюсы для вас:

  • Sol лучше ищет и описывает уязвимости.
  • Модель обучена не помогать в проведении атак, что снижает риск утечек готовых эксплойтов через подсказки.

Минусы и ограничения:

  • На этапе ограниченного доступа часть легитимных запросов по security может блокироваться.
  • Можно столкнуться с дополнительными проверками и задержками.

Если вы строите инструменты анализа кода, конфигураций, логов — GPT-5.6 Sol выглядит перспективно. Но нужно закладывать время на борьбу с «излишне осторожными» фильтрами.

Биологи и научные команды

Sol показывает лучшие результаты, чем GPT-5.5, на GeneBench v1, и при этом тратит меньше токенов. Для вас это означает:

  • Более точные ответы в биологических задачах.
  • Меньше стоимости на те же исследования в сравнении с GPT-5.5.

Если вы уже строите пайплайны на GPT-5.5, имеет смысл планировать миграцию на Sol, когда доступ откроют шире.

Бизнес и продакшн-продукты

Что важно при выборе:

  • Цена за токены: Sol может быть слишком дорогой для массовых пользовательских сценариев.
  • Кэш: если у вас повторяющиеся запросы (FAQ, шаблонные отчёты, цепочки действий), улучшенный кэш GPT-5.6 снизит расходы.
  • Политика доступа: на этапе предварительного доступа OpenAI работает только с согласованным с властями США пулом организаций.

Если вы в России или работаете с российской аудиторией, нужно учитывать ещё два фактора:

  • Доступ к OpenAI часто требует VPN и зарубежный платёжный метод.
  • Юридические и комплаенс-ограничения могут повлиять на возможность прямой интеграции.

Обычные пользователи и ChatGPT

Для тех, кто пользуется ChatGPT «как сервисом»:

  • GPT-5.6 появится в интерфейсе позже, когда OpenAI откроет массовый доступ.
  • Вероятнее всего Sol, Terra и Luna окажутся разнесены по тарифам и уровням подписок.
  • Основные изменения вы почувствуете в качестве кода, сложных рассуждениях, задачах по безопасности и науке.

Если вы используете ChatGPT для бытовых задач, переписки и простых текстов, Luna или Terra, скорее всего, будут более чем достаточно.

Место на рынке

OpenAI позиционирует GPT-5.6 как самое мощное семейство моделей в линейке компании на сегодня.

Внутри экосистемы OpenAI:

  • Sol — новый флагман, который обходит GPT-5.5 в биологических задачах и в кибербезопасности.
  • По GeneBench v1 Sol даёт лучшие результаты при меньшем расходе токенов, чем GPT-5.5.
  • В security-сценариях Sol — самая сильная модель OpenAI.

По ценам внутри линейки:

  • Sol дороже Terra в 2 раза по входным токенам и в 2 раза по выходным.
  • Sol дороже Luna в 5 раз по выходным токенам и в 5 раз по входным.

OpenAI сознательно разделяет уровни:

  • Sol — для тех, кто готов платить за максимум качества и возможностей.
  • Terra — для массовых профессиональных задач.
  • Luna — для сервисов, где важен масштаб и низкая стоимость.

На этапе запуска доступ к GPT-5.6 ограничен и частично завязан на согласование с властями США. Это делает продукт инструментом для избранных, по крайней мере в ближайшие недели. Массовая доступность через ChatGPT и API изменит картину, но позже.

Для разработчиков, стартапов и компаний, которые уже живут в экосистеме OpenAI, GPT-5.6 — это шаг к более мощным агентам, лучшей безопасности и большему контролю над стоимостью через кэш и выбор уровня модели. Для всех остальных это пока скорее сигнал: рынок готовится к новому поколению тяжёлых языковых моделей, но доступ к ним будет не сразу и не у всех.


Читайте также

🔗 Источник: https://openai.com/