GPT‑5.5 проверили на кибербезопасность: как он ищет уязвимости и чем отличается от Claude Mythos — VogueTech

Что нового

Британский AI Security Institute опубликовал оценку киберспособностей GPT‑5.5. Раньше институт разбирал Claude Mythos от Anthropic, теперь тот же подход применили к новой модели OpenAI.

Главный вывод отчёта, на который ссылается Саймон Уиллисон: GPT‑5.5 при поиске уязвимостей показывает результат сопоставимый с Claude Mythos. При этом есть ключевое отличие:

Claude Mythos остаётся специализированной моделью для ограниченного круга партнёров.
GPT‑5.5 уже доступен широкой аудитории через продукты OpenAI.

Институт проверял именно «cyber capabilities» — насколько модель помогает:

находить уязвимости в коде и конфигурациях;
объяснять причины проблемы понятным языком;
предлагать шаги по устранению.

Подробных числовых бенчмарков в ссылке у Уиллисона нет, но он подчёркивает главный факт: по качеству поиска уязвимостей GPT‑5.5 приблизился к Mythos, при этом им можно пользоваться уже сейчас.

Как это работает

AI Security Institute использует для оценки один и тот же подход к разным крупным языковым моделям. Сначала институт протестировал Claude Mythos, затем применил тот же сценарий к GPT‑5.5.

Суть методики:

Модели дают задачи, похожие на работу инженера по безопасности.
Входные данные — код, конфигурации, описания систем.
Ответы проверяют по нескольким осям: нашла ли модель уязвимость, насколько точно её описала, предложила ли рабочее исправление.

Уиллисон в своём посте даёт именно ссылку на этот отчёт: он не разбирает архитектуру GPT‑5.5, не описывает количество параметров или устройство контекста. Фокус — на сравнении с Claude Mythos по способности находить уязвимости.

Важно: речь идёт не о «магии», а о расширении обычных для LLM задач — анализ кода, генерация патчей, объяснение рисков — но в формализованном тесте института, который уже применили к другой сильной модели.

Что это значит для вас

Если вы работаете с безопасностью или просто пишете код, из этого отчёта вынос один: GPT‑5.5 уже можно использовать как помощника по кибербезопасности уровня Mythos.

Практические сценарии:

Быстрый скан кода перед ревью. Копируете фрагмент, просите GPT‑5.5 найти потенциальные уязвимости и объяснить, чем они опасны.
Проверка конфигураций. Nginx, Docker, Kubernetes‑манифесты — модель помогает заметить небезопасные настройки.
Обучение джунов. Можно просить GPT‑5.5 объяснить конкретные уязвимости, разложить их по шагам и предложить безопасный паттерн.
Подготовка к аудиту. Модель пригодится как первый фильтр: она подсветит места, куда потом пойдёт живой специалист.

Где не стоит переоценивать GPT‑5.5:

Финальное слово за людьми. Отчёт института говорит о сопоставимом уровне с Mythos, но не отменяет фальшивых срабатываний и пропущенных багов.
Критичная инфраструктура. Для банковских систем, медицины и госинфраструктуры GPT‑5.5 — только вспомогательный инструмент, а не единственный барьер.

Доступность для России зависит от общей политики OpenAI и локальных ограничений. Для работы может понадобиться VPN и зарубежный аккаунт, как и для других продуктов OpenAI.

Место на рынке

AI Security Institute уже сравнивал в одном формате две сильные модели для задач безопасности:

Claude Mythos (Anthropic) — специализированная модель для кибербезопасности, доступ ограничен, ориентир на профессионалов и партнёрские интеграции.
GPT‑5.5 (OpenAI) — универсальная модель общего назначения, которая при этом, по оценке института, не уступает Mythos в поиске уязвимостей.

Ключевое различие не в качестве, а в доступности:

Mythos остаётся инструментом для ограниченного круга.
GPT‑5.5 уже встроен в экосистему OpenAI и доступен разработчикам и компаниям, которые и так используют продукты OpenAI.

Уиллисон в посте ставит это в контекст других недавних событий:

Выход LLM 0.32a0 — крупный рефактор его собственного инструмента для работы с языковыми моделями.
Публикация истории «похороненного» AGI‑клауза в соглашениях между OpenAI и Microsoft.
Появление DeepSeek V4, который подбирается к «фронтиру» по качеству при гораздо более низкой цене.

На этом фоне GPT‑5.5 с сильными киберспособностями и широкой доступностью усиливает позицию OpenAI в сегменте «универсальная модель, которая достаточно хорошо умеет и безопасность».

Если вы следите за LLM‑рынком

Саймон Уиллисон использует свой блог как ленту быстрых ссылок по LLM. Пост про GPT‑5.5 — это короткий сигнал:

AI Security Institute подтвердил серьёзный уровень GPT‑5.5 в кибербезопасности.
Качество сопоставимо со специализированным Claude Mythos.
Пользоваться этим можно уже сейчас, без ожидания доступа к Mythos.

Для разработчиков и тимлидов это аргумент не откладывать эксперименты с GPT‑5.5 в пайплайнах безопасности: от pre‑commit‑хуков до внутренних ассистентов для security‑команд.

Что нового

Как это работает

Что это значит для вас

Место на рынке

Если вы следите за LLM‑рынком

Читайте также