OpenAI показала GPT-5.6 Sol, Terra и Luna: цены, мощности и кому это вообще нужно — VogueTech

Что нового

OpenAI представила новое семейство языковых моделей GPT-5.6 из трёх уровней:

GPT-5.6 Sol — флагман для самых сложных задач.
GPT-5.6 Terra — золотая середина по мощности и цене.
GPT-5.6 Luna — бюджетный вариант.

Пока доступ есть только у ограниченного круга «доверенных партнёров» через API и Codex. В ближайшие недели OpenAI обещает открыть более широкий доступ, включая интеграцию в ChatGPT.

Новая схема названий

OpenAI перестроила систему именования:

«5.6» — поколение модели.
Sol, Terra, Luna — постоянные названия уровней производительности.
Линейки Sol / Terra / Luna будут развиваться отдельно, а не как один монолитный продукт.

Производительность по бенчмаркам

OpenAI приводит результаты внутренних тестов, в том числе TerminalBench 2.1 — это бенчмарк сложных задач в командной строке:

GPT-5.6 Sol Ultra — 91,9%.
GPT-5.6 Sol (обычный режим) — 88,8%.
GPT-5.6 Terra — 84,3%.
GPT-5.6 Luna — 82,5%.

В биологических задачах (бенчмарк GeneBench v1):

Sol превосходит GPT-5.5 по качеству результатов.
При этом тратит меньше токенов на те же задачи.

OpenAI также называет Sol самой сильной моделью компании в кибербезопасности.

Цены

Стоимость через API отличается довольно сильно:

GPT-5.6 Sol — $5 за 1 млн входных токенов и $30 за 1 млн выходных.
GPT-5.6 Terra — $2,5 за 1 млн входных и $15 за 1 млн выходных.
GPT-5.6 Luna — $1 за 1 млн входных и $6 за 1 млн выходных.

Для сравнения внутри линейки: Sol примерно в 5 раз дороже Luna по выходным токенам.

Режимы Max и Ultra для Sol

У Sol есть два дополнительных режима:

Max — даёт модели больше времени на рассуждения при сложных задачах.
Ultra — запускает несколько субагентов, которые параллельно решают части задачи и ускоряют сложные рабочие процессы.

Кэширование запросов в API

OpenAI доработала кэш в API для GPT-5.6:

Появились явные точки сброса кэша (cache breakpoints) — разработчик может управлять, где кэш обнуляется.
Минимальное время хранения кэшированных запросов увеличено до 30 минут.

Это снижает стоимость и ускоряет повторяющиеся запросы, особенно в больших пайплайнах.

Безопасность и тестирование

OpenAI делает серьёзный акцент на безопасном поведении GPT-5.6:

GPT-5.6 получила «самый надёжный стек защитных механизмов» в истории OpenAI.
Sol обучили жёстко отказываться от запроса помощи в кибератаках — даже если пользователь скрывает намерения, пытается обмануть или использовать джейлбрейки.
Sol лучше находит и исправляет уязвимости, чем помогает проводить полноценные атаки.

Масштаб тестирования:

На автоматизированное тестирование защиты ушло более 700 000 GPU-часов на акселераторах уровня NVIDIA A100.
В тестировании участвовали независимые специалисты по безопасности, и они продолжат проверки на протяжении всего периода предварительного доступа.

Во время ограниченного тестирования OpenAI включает усиленные фильтры:

Некоторые легитимные запросы, особенно по исследованиям в области информационной безопасности, могут временно блокироваться или отправляться на дополнительную проверку.
Обратная связь от таких кейсов нужна OpenAI, чтобы настроить защиту перед массовым запуском.

Политический контекст запуска

Релиз GPT-5.6 произошёл менее чем через сутки после сообщений СМИ о том, что OpenAI отложит запуск по просьбе администрации президента США Дональда Трампа.

Во время предварительного тестирования:

Доступ к модели получит ограниченный круг организаций.
Этот список согласован с властями США.

OpenAI говорит, что не считает такую процедуру нормой. Компания заявляет, что сотрудничала с правительством США перед запуском GPT-5.6, но рассчитывает, что в будущем новые модели будут запускаться без предварительного государственного согласования.

Как это работает

OpenAI не раскрывает архитектуру GPT-5.6, но по описанию можно сделать несколько выводов о том, что происходит под капотом.

Семейство из трёх уровней

Sol, Terra и Luna — это не просто разные «тарифы», а три независимые ветки развития:

Sol — максимум параметров, сложные цепочки рассуждений, длинные агентные сценарии.
Terra — баланс между стоимостью и качеством кода, безопасности и научных задач.
Luna — оптимизация под цену и массовые сценарии, где важнее объём, чем пик качества.

Агентные сценарии и субагенты

Sol специально настраивали под длительные агентные сценарии:

Модель умеет планировать последовательность шагов и выполнять их по очереди.
В режиме Ultra Sol использует несколько субагентов. Каждый отвечает за свою часть задачи или этап пайплайна.
Это особенно полезно для сложных рабочих процессов: CI/CD, анализ логов, автоматизация инфраструктуры.

Max: больше времени на размышления

Режим Max для Sol — это по сути более «долго думающий» режим:

Модели дают больше вычислительных ресурсов на один запрос.
Она может строить более длинные цепочки рассуждений.
Это нужно для задач, где ошибка дорого стоит: безопасность, биоинформатика, сложная архитектура ПО.

Кэширование и cache breakpoints

Кэш в API GPT-5.6 работает как слой сохранения промежуточных шагов:

Если ваш запрос повторяет большую часть предыдущего, модель может использовать сохранённые промежуточные вычисления.
Cache breakpoints позволяют явно сказать: «Вот здесь начинается новая логика, старый кэш больше не подходит».
Минимальное время хранения кэшированных запросов — 30 минут, что полезно для интерактивных сессий, IDE, агентных систем.

Безопасность под нагрузкой

Масштаб тестирования (700 тыс. GPU-часов) говорит о том, что OpenAI:

Массово прогоняла GPT-5.6 через сценарии джейлбрейков и попыток обхода ограничений.
Отдельно учила модель распознавать завуалированные попытки кибератак.
Балансирует между полезными задачами по безопасности (поиск уязвимостей) и блокировкой вредоносных сценариев.

Что это значит для вас

Разработчики и инженеры

Когда имеет смысл смотреть на GPT-5.6 Sol:

Вам нужны сложные цепочки действий: DevOps-агенты, автоматизация инфраструктуры, сложные пайплайны данных.
Вы работаете с кибербезопасностью: аудит кода, поиск уязвимостей, анализ конфигураций.
Вы занимаетесь биологией и биоинформатикой: анализ последовательностей, гипотезы по экспериментам, работа с научными текстами.
Бюджет позволяет жить с ценами $5 / $30 за миллион токенов.

Когда логичнее взять Terra:

Вам нужен баланс цены и качества.
Задачи — обычная разработка, документация, аналитика, бизнес-отчёты.
Вы хотите использовать GPT-5.6 в продуктах с большим трафиком, но Sol получается слишком дорогой.

Когда подойдёт Luna:

Нужен массовый сервис: чат-поддержка, генерация описаний, внутренняя автоматизация.
Важнее стоимость, чем максимальное качество.
Цена $1 / $6 за миллион токенов делает Luna интересной для стартапов и внутренних корпоративных инструментов.

Исследователи безопасности

Плюсы для вас:

Sol лучше ищет и описывает уязвимости.
Модель обучена не помогать в проведении атак, что снижает риск утечек готовых эксплойтов через подсказки.

Минусы и ограничения:

На этапе ограниченного доступа часть легитимных запросов по security может блокироваться.
Можно столкнуться с дополнительными проверками и задержками.

Если вы строите инструменты анализа кода, конфигураций, логов — GPT-5.6 Sol выглядит перспективно. Но нужно закладывать время на борьбу с «излишне осторожными» фильтрами.

Биологи и научные команды

Sol показывает лучшие результаты, чем GPT-5.5, на GeneBench v1, и при этом тратит меньше токенов. Для вас это означает:

Более точные ответы в биологических задачах.
Меньше стоимости на те же исследования в сравнении с GPT-5.5.

Если вы уже строите пайплайны на GPT-5.5, имеет смысл планировать миграцию на Sol, когда доступ откроют шире.

Бизнес и продакшн-продукты

Что важно при выборе:

Цена за токены: Sol может быть слишком дорогой для массовых пользовательских сценариев.
Кэш: если у вас повторяющиеся запросы (FAQ, шаблонные отчёты, цепочки действий), улучшенный кэш GPT-5.6 снизит расходы.
Политика доступа: на этапе предварительного доступа OpenAI работает только с согласованным с властями США пулом организаций.

Если вы в России или работаете с российской аудиторией, нужно учитывать ещё два фактора:

Доступ к OpenAI часто требует VPN и зарубежный платёжный метод.
Юридические и комплаенс-ограничения могут повлиять на возможность прямой интеграции.

Обычные пользователи и ChatGPT

Для тех, кто пользуется ChatGPT «как сервисом»:

GPT-5.6 появится в интерфейсе позже, когда OpenAI откроет массовый доступ.
Вероятнее всего Sol, Terra и Luna окажутся разнесены по тарифам и уровням подписок.
Основные изменения вы почувствуете в качестве кода, сложных рассуждениях, задачах по безопасности и науке.

Если вы используете ChatGPT для бытовых задач, переписки и простых текстов, Luna или Terra, скорее всего, будут более чем достаточно.

Место на рынке

OpenAI позиционирует GPT-5.6 как самое мощное семейство моделей в линейке компании на сегодня.

Внутри экосистемы OpenAI:

Sol — новый флагман, который обходит GPT-5.5 в биологических задачах и в кибербезопасности.
По GeneBench v1 Sol даёт лучшие результаты при меньшем расходе токенов, чем GPT-5.5.
В security-сценариях Sol — самая сильная модель OpenAI.

По ценам внутри линейки:

Sol дороже Terra в 2 раза по входным токенам и в 2 раза по выходным.
Sol дороже Luna в 5 раз по выходным токенам и в 5 раз по входным.

OpenAI сознательно разделяет уровни:

Sol — для тех, кто готов платить за максимум качества и возможностей.
Terra — для массовых профессиональных задач.
Luna — для сервисов, где важен масштаб и низкая стоимость.

На этапе запуска доступ к GPT-5.6 ограничен и частично завязан на согласование с властями США. Это делает продукт инструментом для избранных, по крайней мере в ближайшие недели. Массовая доступность через ChatGPT и API изменит картину, но позже.

Для разработчиков, стартапов и компаний, которые уже живут в экосистеме OpenAI, GPT-5.6 — это шаг к более мощным агентам, лучшей безопасности и большему контролю над стоимостью через кэш и выбор уровня модели. Для всех остальных это пока скорее сигнал: рынок готовится к новому поколению тяжёлых языковых моделей, но доступ к ним будет не сразу и не у всех.