Дата публикации
ai_products

GPT‑5.5 проверили на кибербезопасность: как он ищет уязвимости и чем отличается от Claude Mythos

Что нового

Британский AI Security Institute опубликовал оценку киберспособностей GPT‑5.5. Раньше институт разбирал Claude Mythos от Anthropic, теперь тот же подход применили к новой модели OpenAI.

Главный вывод отчёта, на который ссылается Саймон Уиллисон: GPT‑5.5 при поиске уязвимостей показывает результат сопоставимый с Claude Mythos. При этом есть ключевое отличие:

  • Claude Mythos остаётся специализированной моделью для ограниченного круга партнёров.
  • GPT‑5.5 уже доступен широкой аудитории через продукты OpenAI.

Институт проверял именно «cyber capabilities» — насколько модель помогает:

  • находить уязвимости в коде и конфигурациях;
  • объяснять причины проблемы понятным языком;
  • предлагать шаги по устранению.

Подробных числовых бенчмарков в ссылке у Уиллисона нет, но он подчёркивает главный факт: по качеству поиска уязвимостей GPT‑5.5 приблизился к Mythos, при этом им можно пользоваться уже сейчас.

Как это работает

AI Security Institute использует для оценки один и тот же подход к разным крупным языковым моделям. Сначала институт протестировал Claude Mythos, затем применил тот же сценарий к GPT‑5.5.

Суть методики:

  • Модели дают задачи, похожие на работу инженера по безопасности.
  • Входные данные — код, конфигурации, описания систем.
  • Ответы проверяют по нескольким осям: нашла ли модель уязвимость, насколько точно её описала, предложила ли рабочее исправление.

Уиллисон в своём посте даёт именно ссылку на этот отчёт: он не разбирает архитектуру GPT‑5.5, не описывает количество параметров или устройство контекста. Фокус — на сравнении с Claude Mythos по способности находить уязвимости.

Важно: речь идёт не о «магии», а о расширении обычных для LLM задач — анализ кода, генерация патчей, объяснение рисков — но в формализованном тесте института, который уже применили к другой сильной модели.

Что это значит для вас

Если вы работаете с безопасностью или просто пишете код, из этого отчёта вынос один: GPT‑5.5 уже можно использовать как помощника по кибербезопасности уровня Mythos.

Практические сценарии:

  • Быстрый скан кода перед ревью. Копируете фрагмент, просите GPT‑5.5 найти потенциальные уязвимости и объяснить, чем они опасны.
  • Проверка конфигураций. Nginx, Docker, Kubernetes‑манифесты — модель помогает заметить небезопасные настройки.
  • Обучение джунов. Можно просить GPT‑5.5 объяснить конкретные уязвимости, разложить их по шагам и предложить безопасный паттерн.
  • Подготовка к аудиту. Модель пригодится как первый фильтр: она подсветит места, куда потом пойдёт живой специалист.

Где не стоит переоценивать GPT‑5.5:

  • Финальное слово за людьми. Отчёт института говорит о сопоставимом уровне с Mythos, но не отменяет фальшивых срабатываний и пропущенных багов.
  • Критичная инфраструктура. Для банковских систем, медицины и госинфраструктуры GPT‑5.5 — только вспомогательный инструмент, а не единственный барьер.

Доступность для России зависит от общей политики OpenAI и локальных ограничений. Для работы может понадобиться VPN и зарубежный аккаунт, как и для других продуктов OpenAI.

Место на рынке

AI Security Institute уже сравнивал в одном формате две сильные модели для задач безопасности:

  • Claude Mythos (Anthropic) — специализированная модель для кибербезопасности, доступ ограничен, ориентир на профессионалов и партнёрские интеграции.
  • GPT‑5.5 (OpenAI) — универсальная модель общего назначения, которая при этом, по оценке института, не уступает Mythos в поиске уязвимостей.

Ключевое различие не в качестве, а в доступности:

  • Mythos остаётся инструментом для ограниченного круга.
  • GPT‑5.5 уже встроен в экосистему OpenAI и доступен разработчикам и компаниям, которые и так используют продукты OpenAI.

Уиллисон в посте ставит это в контекст других недавних событий:

  • Выход LLM 0.32a0 — крупный рефактор его собственного инструмента для работы с языковыми моделями.
  • Публикация истории «похороненного» AGI‑клауза в соглашениях между OpenAI и Microsoft.
  • Появление DeepSeek V4, который подбирается к «фронтиру» по качеству при гораздо более низкой цене.

На этом фоне GPT‑5.5 с сильными киберспособностями и широкой доступностью усиливает позицию OpenAI в сегменте «универсальная модель, которая достаточно хорошо умеет и безопасность».

Если вы следите за LLM‑рынком

Саймон Уиллисон использует свой блог как ленту быстрых ссылок по LLM. Пост про GPT‑5.5 — это короткий сигнал:

  • AI Security Institute подтвердил серьёзный уровень GPT‑5.5 в кибербезопасности.
  • Качество сопоставимо со специализированным Claude Mythos.
  • Пользоваться этим можно уже сейчас, без ожидания доступа к Mythos.

Для разработчиков и тимлидов это аргумент не откладывать эксперименты с GPT‑5.5 в пайплайнах безопасности: от pre‑commit‑хуков до внутренних ассистентов для security‑команд.


Читайте также