- Дата публикации
GPT‑5.5 проверили на кибербезопасность: как он ищет уязвимости и чем отличается от Claude Mythos
Что нового
Британский AI Security Institute опубликовал оценку киберспособностей GPT‑5.5. Раньше институт разбирал Claude Mythos от Anthropic, теперь тот же подход применили к новой модели OpenAI.
Главный вывод отчёта, на который ссылается Саймон Уиллисон: GPT‑5.5 при поиске уязвимостей показывает результат сопоставимый с Claude Mythos. При этом есть ключевое отличие:
- Claude Mythos остаётся специализированной моделью для ограниченного круга партнёров.
- GPT‑5.5 уже доступен широкой аудитории через продукты OpenAI.
Институт проверял именно «cyber capabilities» — насколько модель помогает:
- находить уязвимости в коде и конфигурациях;
- объяснять причины проблемы понятным языком;
- предлагать шаги по устранению.
Подробных числовых бенчмарков в ссылке у Уиллисона нет, но он подчёркивает главный факт: по качеству поиска уязвимостей GPT‑5.5 приблизился к Mythos, при этом им можно пользоваться уже сейчас.
Как это работает
AI Security Institute использует для оценки один и тот же подход к разным крупным языковым моделям. Сначала институт протестировал Claude Mythos, затем применил тот же сценарий к GPT‑5.5.
Суть методики:
- Модели дают задачи, похожие на работу инженера по безопасности.
- Входные данные — код, конфигурации, описания систем.
- Ответы проверяют по нескольким осям: нашла ли модель уязвимость, насколько точно её описала, предложила ли рабочее исправление.
Уиллисон в своём посте даёт именно ссылку на этот отчёт: он не разбирает архитектуру GPT‑5.5, не описывает количество параметров или устройство контекста. Фокус — на сравнении с Claude Mythos по способности находить уязвимости.
Важно: речь идёт не о «магии», а о расширении обычных для LLM задач — анализ кода, генерация патчей, объяснение рисков — но в формализованном тесте института, который уже применили к другой сильной модели.
Что это значит для вас
Если вы работаете с безопасностью или просто пишете код, из этого отчёта вынос один: GPT‑5.5 уже можно использовать как помощника по кибербезопасности уровня Mythos.
Практические сценарии:
- Быстрый скан кода перед ревью. Копируете фрагмент, просите GPT‑5.5 найти потенциальные уязвимости и объяснить, чем они опасны.
- Проверка конфигураций. Nginx, Docker, Kubernetes‑манифесты — модель помогает заметить небезопасные настройки.
- Обучение джунов. Можно просить GPT‑5.5 объяснить конкретные уязвимости, разложить их по шагам и предложить безопасный паттерн.
- Подготовка к аудиту. Модель пригодится как первый фильтр: она подсветит места, куда потом пойдёт живой специалист.
Где не стоит переоценивать GPT‑5.5:
- Финальное слово за людьми. Отчёт института говорит о сопоставимом уровне с Mythos, но не отменяет фальшивых срабатываний и пропущенных багов.
- Критичная инфраструктура. Для банковских систем, медицины и госинфраструктуры GPT‑5.5 — только вспомогательный инструмент, а не единственный барьер.
Доступность для России зависит от общей политики OpenAI и локальных ограничений. Для работы может понадобиться VPN и зарубежный аккаунт, как и для других продуктов OpenAI.
Место на рынке
AI Security Institute уже сравнивал в одном формате две сильные модели для задач безопасности:
- Claude Mythos (Anthropic) — специализированная модель для кибербезопасности, доступ ограничен, ориентир на профессионалов и партнёрские интеграции.
- GPT‑5.5 (OpenAI) — универсальная модель общего назначения, которая при этом, по оценке института, не уступает Mythos в поиске уязвимостей.
Ключевое различие не в качестве, а в доступности:
- Mythos остаётся инструментом для ограниченного круга.
- GPT‑5.5 уже встроен в экосистему OpenAI и доступен разработчикам и компаниям, которые и так используют продукты OpenAI.
Уиллисон в посте ставит это в контекст других недавних событий:
- Выход LLM 0.32a0 — крупный рефактор его собственного инструмента для работы с языковыми моделями.
- Публикация истории «похороненного» AGI‑клауза в соглашениях между OpenAI и Microsoft.
- Появление DeepSeek V4, который подбирается к «фронтиру» по качеству при гораздо более низкой цене.
На этом фоне GPT‑5.5 с сильными киберспособностями и широкой доступностью усиливает позицию OpenAI в сегменте «универсальная модель, которая достаточно хорошо умеет и безопасность».
Если вы следите за LLM‑рынком
Саймон Уиллисон использует свой блог как ленту быстрых ссылок по LLM. Пост про GPT‑5.5 — это короткий сигнал:
- AI Security Institute подтвердил серьёзный уровень GPT‑5.5 в кибербезопасности.
- Качество сопоставимо со специализированным Claude Mythos.
- Пользоваться этим можно уже сейчас, без ожидания доступа к Mythos.
Для разработчиков и тимлидов это аргумент не откладывать эксперименты с GPT‑5.5 в пайплайнах безопасности: от pre‑commit‑хуков до внутренних ассистентов для security‑команд.