Дата публикации
ai_products

Anthropic представила Claude Fable 5 и Mythos 5: максимум мощности с жёсткими ограничениями по кибербезопасности и биологии

Что нового

Anthropic запустила сразу два флагмана:

  • Claude Fable 5 — публичная Mythos‑класса модель, доступная всем пользователям Anthropic.
  • Claude Mythos 5 — тот же базовый ИИ, но с частично снятыми ограничениями. Пока только для узкого круга киберзащитников и биотех‑исследователей.

Ключевые факты по Fable 5 и Mythos 5:

  • Класс мощности: Mythos‑класс — более сильный, чем все предыдущие массовые модели Anthropic.

  • Производительность на бенчмарках:

    • Лидирует на большинстве тестов Anthropic по программированию, аналитике, vision‑задачам и научным задачам.
    • На Cognition FrontierCode (сложные продакшен‑задачи по коду) Fable 5 показывает лучший результат среди frontier‑моделей даже на среднем уровне «усилий».
    • На CursorBench — новый лидер по «длинным» кодовым задачам.
    • На Hebbia Finance Benchmark для senior‑уровня рассуждений в финансах — самый высокий балл среди протестированных моделей.
    • На внутреннем FrontierBench от Cognition — топовый результат по «агентному» кодингу.
    • На core‑аналитическом бенчмарке Hebbia Fable 5 впервые пробивает 90% — на 10 пунктов выше Opus 4.8.
  • Инженерия ПО:

    • Stripe: Fable 5 провёл миграцию по коду на 50 млн строк Ruby за один день — работа, которая заняла бы у команды более двух месяцев вручную.
    • Больше эффективности по токенам по сравнению с прошлыми Claude: те же задачи — меньше токенов и меньше шагов.
  • Vision:

    • Новый SOTA у Anthropic для задач с картинками и интерфейсами.
    • Извлекает точные числа из сложных научных графиков.
    • Способен пересобрать исходники веб‑приложения по скриншотам.
    • Прошлые Claude с трудом играли в Pokémon FireRed даже с дополнительными инструментами. Fable 5 прошёл FireRed с минимальным vision‑хэндлером, без тяжёлых «костылей».
  • Память и длинный контекст:

    • Держит фокус на миллионах токенов в длинных сессиях.
    • Умеет использовать собственные заметки и файловую память.
    • В игре Slay the Spire при доступе к постоянной файловой памяти Fable 5 улучшил результат в 3 раза сильнее, чем Opus 4.8, и в 3 раза чаще доходил до финального акта.
  • Life sciences и биология (в основном через Mythos 5):

    • Ускорение отдельных этапов дизайна лекарств примерно в 10 раз.
    • В одном из кейсов Mythos 5, используя инструменты для дизайна белков и биоинформатики без участия человека, показал уровень не хуже опытного специалиста.
    • В исследовании по 14 белков 9 целей дали сильных кандидатов для разработки лекарств.
    • В молекулярной биологии Mythos 5 стабильно генерирует новые гипотезы: в слепых сравнениях с Opus‑классом эксперты выбирали гипотезы Mythos примерно в 80% случаев.
    • Одна гипотеза о механизме белка E. coli позже подтвердилась в независимом академическом исследовании.
    • В геномике Mythos 5 за неделю почти автономной работы:
      • Собрал single‑cell данные по миллионам клеток из 138 видов животных.
      • Спроектировал и обучил кастомную ML‑модель для поиска однотипных клеток у далёко родственных видов.
      • Итоговая модель превзошла недавний результат из журнала Science, будучи при этом в 100 раз меньше по размеру.
  • Безопасность и выравнивание:

    • Автоматическая оценка alignment: уровень «несогласованного» поведения (обман, помощь в злоупотреблениях) у Mythos 5 сопоставим с Opus 4.8.
    • Fable 5 использует тот же базовый ИИ, значит, уровень alignment примерно такой же.
  • Ограничения и фоллбэки:

    • На запросы по кибербезопасности, биологии/химии и попытки дистилляции для Fable 5 включаются отдельные классификаторы.
    • В этих случаях ответ вместо Fable 5 даёт Claude Opus 4.8.
    • По данным Anthropic, такие фоллбэки происходят менее чем в 5% сессий. В остальных случаях поведение Fable 5 практически совпадает с Mythos 5.
  • Устойчивость к jailbreak:

    • Внешний партнёр Anthropic не получил ни одного «вредного» ответа Fable 5 на одиночные запросы по планированию кибератак, разработке эксплойтов и обходу защиты.
    • Это сохранялось даже при использовании 30 публичных техник jailbreak.
  • Цена:

    • $10 за 1 млн входных токенов.
    • $50 за 1 млн выходных токенов.
    • Это менее половины стоимости Claude Mythos Preview.
  • Политика данных:

    • Для Fable 5, Mythos 5 и будущих моделей такого же или более высокого уровня Anthropic вводит обязательное хранение данных 30 дней.
    • Эти данные не используют для обучения новых моделей Claude и для любых целей, не связанных с безопасностью.
    • Всякий доступ людей к этим данным логируется, по истечении 30 дней данные почти всегда удаляются.
  • Доступность:

    • Fable 5 доступен повсеместно через API (endpoint claude-fable-5).
    • Mythos 5: пока только партнёры проекта Glasswing (кибербезопасность) и далее — ограниченный круг биомедицинских исследователей по программе доверенного доступа.

Как это работает

Общая архитектура

Anthropic не раскрывает точную архитектуру Mythos‑класса, но по описанию видно несколько ключевых черт:

  • Один базовый ИИ — два продукта:

    • Fable 5 и Mythos 5 — это один и тот же базовый модельный стек.
    • Разница — в уровне включённых ограничений по кибербезопасности и биологии/химии.
  • Классификаторы‑фильтры вокруг основного ИИ:

    • Вокруг Fable 5 работают отдельные модели‑классификаторы.
    • Они анализируют запрос и контекст сессии и решают, можно ли отдать ответ Fable 5 или нужно переключиться на Opus 4.8.

Классификаторы покрывают три зоны:

  1. Кибербезопасность

    • Отлавливают:
      • запросы на поиск и эксплуатацию уязвимостей;
      • планирование атак, lateral movement, обход защит;
      • «агентный» хакинг, где модель берёт на себя несколько этапов атаки.
    • Внутренние графики Anthropic показывают: при включённых фильтрах Fable 5 не продвигается по задачам offensive‑кибератак.
    • Модель активно «краснили» (red teaming) внутри и через внешний bug bounty: более 1000 часов тестов не дали универсального jailbreak.
    • Отдельные исследователи (включая UK AISI) нашли прогресс в сторону взлома на длинных агентных задачах, Anthropic честно говорит, что полностью исключить универсальные jailbreak, вероятно, невозможно.
  2. Биология и химия

    • Раньше Anthropic блокировала только узкий набор запросов по биологическому оружию.
    • С Mythos‑классом этого уже мало:
      • модель способна решать реальные научные задачи (пример с AAV и белками);
      • есть риск, что хорошо подготовленные злоумышленники получат серьёзный «апгрейд» по опасным биотемам.
    • В тестах по дизайну AAV Mythos 5, без специального обучения под задачу, обошёл специализированные protein language models, используя общую биологическую логику.
    • Пока Anthropic включает широкий блок: большинство запросов по биологии/химии в Fable 5 уходит в Opus 4.8.
    • Для Mythos 5 в рамках доверенного доступа эти ограничения частично снимают.
  3. Дистилляция

    • Anthropic уже ловила попытки массово «слить» поведение Claude для обучения конкурирующих моделей в авторитарных странах.
    • Для Fable 5 ввели фильтры, которые распознают паттерны запросов, похожие на систематическую дистилляцию.
    • При срабатывании запрос переходит на Opus 4.8.

Длинные задачи и агентность

Fable 5 и Mythos 5 заметно лучше ведут себя на длинных горизонтах:

  • Автономная работа: модели могут часами выполнять цепочки задач, фиксировать промежуточные результаты и корректировать курс.
  • Файловая память: в примере со Slay the Spire модели дали доступ к постоянным файлам. Fable 5 научился использовать их гораздо эффективнее, чем Opus 4.8.
  • Саморефлексия: при «высоком усилии» Fable 5 сам проверяет и валидирует свои результаты. Юристы‑бета‑тестеры сообщили, что redline‑правки Fable 5 в слепом сравнении каждый раз были не хуже их текущей модели.

Специализация под домены

Anthropic активно валидирует Fable 5 и Mythos 5 на реальных задачах партнёров:

  • Инженерия ПО: Stripe, GitHub, Cognition, Cursor.
  • Финансы: Hebbia, IMC и другие партнёры.
  • Физика: исследовательские команды, которые сравнивали Fable 5 с GPT‑5.5 (по их данным, Fable 5 за 36 часов дошёл почти до результата GPT‑5.5 за 4 дня, используя треть reasoning‑токенов).
  • Продвинутый аналитический софт: Hebbia, аналитические бенчмарки по таблицам, графикам и длинным документам.

Политика данных и мониторинг

  • Для всех Mythos‑класса моделей (включая Fable 5):
    • Все запросы и ответы хранятся 30 дней.
    • Доступ людей к этим данным логируется.
    • Данные используют только для:
      • поиска новых jailbreak;
      • анализа сложных атак, которые проходят через много запросов;
      • улучшения классификаторов и снижения ложных срабатываний.
    • По истечении срока данные почти всегда удаляются.

Что это значит для вас

Где Fable 5 реально помогает

1. Разработка и сопровождение кода

Если вы разработчик или CTO, Fable 5 — про тяжёлые и длинные задачи:

  • Миграции и рефакторинг огромных кодовых баз (десятки миллионов строк).
  • Автоматизация рутинных изменений по всему репозиторию.
  • Быстрое прототипирование сложных фич и сервисов.
  • Работа с незнакомыми фреймворками и инструментами: по данным Cognition, Fable 5 хорошо «обобщает» на новые тулчейны.

Сигналы от партнёров:

  • GitHub: Fable 5 решает длинные агентные задачи в коде надёжнее прошлых моделей.
  • CursorBench: Fable 5 — лучший результат, открывает задачи, которые раньше были «слишком длинными» для ИИ‑ассистентов.
  • Cognition: модель требует меньше итераций (turns) и токенов для решения сложных задач.

Практический вывод: если вы уже используете ИИ для кода (GitHub Copilot, Claude Code, Cursor), Fable 5 стоит попробовать на задачах уровня «переписать модуль/сервис/репозиторий», а не только на автодополнении.


2. Аналитика, финансы и документооборот

Для аналитиков, продуктов, финансистов и юристов Fable 5 интересен в трёх зонах:

  • Финансовый анализ:

    • На Hebbia Finance Benchmark для senior‑уровня рассуждений Fable 5 показывает лучший результат среди протестированных моделей.
    • IMC: Fable 5 прошёл их трейдинговые тесты почти по всем метрикам — фактология, концептуальное мышление, root‑cause анализ, оценка ожидаемой стоимости.
  • Глубокая аналитика:

    • На core‑бенчмарке Hebbia по длинным аналитическим задачам Fable 5 превысил 90%, прыгнув на 10 пунктов относительно Opus 4.8.
    • Партнёры отмечают, что модель лучше держит нюансы и контекст, чем прошлые версии.
  • Юридические задачи и документы:

    • Юристы‑бета‑тестеры сообщают, что в слепом ревью redline‑правки Fable 5 каждый раз были не хуже их текущей референс‑модели.
    • При максимальном уровне «усилий» модель сама проверяет и валидирует свои правки, что важно для частично автономных сценариев.

Практический вывод: Fable 5 имеет смысл подключать к:

  • анализу длинных отчётов и презентаций;
  • построению сложных моделей в Excel/Sheets (модель побеждает Opus 4.8 на ежедневном spreadsheet‑наборе задач и делает это на 25–30% быстрее, с меньшим числом шагов);
  • подготовке инвестиционных меморандумов и юридических документов, где важна точность формулировок.

3. Vision‑задачи и интерфейсы

Если вы дизайнер, продукт, фронтенд‑разработчик или работаете с данными в картинках, Fable 5 интересен тем, что:

  • умеет извлекать точные численные данные из научных графиков и сложных диаграмм;
  • может по скриншотам интерфейса восстановить исходный код веб‑приложения;
  • стабильно решает сложные «игровые» задачи на vision, как Pokémon FireRed, без тяжёлого набора вспомогательных инструментов.

Практический вывод: Fable 5 можно использовать как:

  • ассистента по ревёрс‑инжинирингу интерфейсов (скриншот → код);
  • помощника для быстрого разбора PDF с графиками и таблицами;
  • «второй мозг» для UI/UX‑экспериментов, когда нужно быстро собрать прототипы.

4. Научные исследования и биотех

Здесь нужно разделить два сценария:

  • Fable 5 (общий доступ):

    • Из‑за широкого фильтра по биологии и химии многие запросы будут уходить в Opus 4.8.
    • Это снижает риск злоупотреблений, но ограничивает глубину ответов по сложным биотемам.
  • Mythos 5 (доверенный доступ):

    • Для киберзащитников в Project Glasswing модель доступна с ослабленными ограничениями по кибербезопасности.
    • Для биомедицинских исследователей Anthropic готовит программу доверенного доступа к биологии: Fable 5 с отключёнными ограничениями по биологии и химии, но с сохранёнными кибер‑ограничениями.

Кейсы, которые уже показали Mythos 5:

  • ускорение отдельных этапов дизайна лекарств примерно в 10 раз;
  • способность самостоятельно выбирать участки связывания, запускать инструменты для дизайна белков и восстанавливаться после неудач;
  • генерация гипотез, которые реальные исследователи считают достаточно сильными, чтобы вести по ним эксперименты.

Практический вывод:

  • Если вы биолог/биотех‑фаундер, Fable 5 в открытом доступе пригодится скорее для общих рассуждений и литературы. Для серьёзной R&D‑работы нужен доступ к Mythos 5 через программу доверенного доступа.
  • Если вы киберзащитник или инфраструктурный провайдер, имеет смысл смотреть в сторону участия в Project Glasswing и Mythos 5.

5. Где Fable 5 использовать не стоит

  • Оффенсивная кибербезопасность:

    • Fable 5 сознательно «задушен» по этой части. Запросы про разработку эксплойтов, планирование атак, обфускацию и т.п. либо будут заблокированы, либо уйдут в Opus 4.8 с безопасным ответом.
  • Глубокая практическая биология/химия:

    • Большая часть таких запросов в Fable 5 уходит в Opus 4.8. Если вы рассчитываете на помощь в сложных wet‑lab‑протоколах или дизайне патогенов, модель будет специально ограничена.
  • Если вы не готовы к 30‑дневному хранению данных:

    • Для некоторых корпоративных политик это может быть критично. Тогда лучше использовать менее мощные модели без жёсткого retention или локальные решения.

Доступ из России

Anthropic официально говорит, что Fable 5 доступен «повсеместно», но не раскрывает список стран и ограничений. На практике для доступа к Claude‑моделям из России часто используют VPN и зарубежные аккаунты.

Практический совет:

  • Если вы работаете из России, будьте готовы к необходимости VPN и регистрации через иностранный платёжный метод или инфраструктуру партнёров.
  • Для корпоративных команд с жёсткими требованиями по соответствию законам РФ использование зарубежных ИИ‑API может быть юридически чувствительным — это нужно оценивать отдельно.

Место на рынке

Прямые конкуренты

Anthropic позиционирует Fable 5 как модель, которая по суммарным возможностям превосходит все предыдущие общедоступные Claude и конкурирует с самыми мощными моделями рынка.

По фактам из анонса:

  • По коду:

    • На Cognition FrontierCode Fable 5 показывает лучший результат среди frontier‑моделей, включая GPT‑линейку, при этом на среднем уровне усилия.
    • На CursorBench Fable 5 — новый лидер по длинным кодовым задачам.
    • Cognition отмечает, что Fable 5 доходит почти до результата GPT‑5.5 по frontier‑физике за 36 часов, тогда как GPT‑5.5 тратит 4 дня, и при этом Fable 5 использует треть reasoning‑токенов.
  • По аналитике и финансам:

    • На Hebbia Finance Benchmark для senior‑уровня рассуждений Fable 5 показывает максимальный балл среди протестированных моделей.
    • На core‑аналитическом бенчмарке Hebbia Fable 5 впервые пробивает 90%, обгоняя Opus 4.8 на 10 пунктов.
  • По vision:

    • Для задач Anthropic Fable 5 — новый внутренний SOTA, в том числе по сценариям с восстановлением кода из интерфейсов и сложным научным графикам.

Цена и экономика использования

  • Fable 5 / Mythos 5: $10 за 1 млн входных токенов и $50 за 1 млн выходных.
  • Сравнение внутри Anthropic:
    • По словам Anthropic, это менее половины цены Claude Mythos Preview.
    • При этом Mythos 5 сопоставим или немного сильнее Mythos Preview, а Fable 5 в большинстве задач ведёт себя как Mythos 5 (если не включаются фильтры).

Что это означает на практике:

  • Для больших проектов (миграция крупных кодовых баз, массовый анализ документов, сложные агентные пайплайны) Fable 5 может быть дешевле по TCO, чем более слабые модели:
    • меньше токенов на задачу;
    • меньше итераций человек‑ИИ;
    • выше вероятность «одним дублем» решить сложную задачу.

Позиция относительно других Claude

Если смотреть только на линейку Anthropic:

  • Opus 4.8:

    • всё ещё очень мощная модель;
    • используется как fallback для Fable 5 при срабатывании классификаторов;
    • дешевле, чем старый Mythos Preview, но дороже, чем Fable 5/ Mythos 5, по данным анонса.
  • Fable 5:

    • максимальная мощность, доступная широкой аудитории Anthropic;
    • жёсткие фильтры по кибербезопасности, биологии и дистилляции.
  • Mythos 5:

    • тот же уровень мощности, но с ослабленными ограничениями для узкого круга партнёров;
    • ориентирован на киберзащиту (Project Glasswing) и биомедицинские исследования по доверенной программе.

Кому Fable 5 особенно выгоден

  • Разработчикам и компаниям с большими кодовыми базами:

    • миграции, рефакторинг, массовые изменения — сильная сторона Fable 5;
    • в связке с Cursor, Claude Code и подобными инструментами модель уже показывает лучшие результаты.
  • Финансовым и аналитическим командам:

    • бенчмарки Hebbia и отзывы IMC показывают, что Fable 5 особенно силён в сложной аналитике и финансах.
  • Юридическим и корпоративным департаментам:

    • качественные redline‑правки, самопроверка на высоком уровне усилий, ускорение документооборота.
  • Исследовательским группам в физике и наукоёмких областях:

    • по отзывам партнёров, Fable 5 показывает очень сильные результаты в frontier‑физике и научных задачах при меньшем расходе reasoning‑токенов.

Как запустить

Anthropic объявляет, что Fable 5 доступен через Claude API под именем claude-fable-5.

Базовый сценарий для разработчиков:

  1. Получить доступ к Claude API (регистрация аккаунта Anthropic, получение API‑ключа).
  2. Использовать endpoint claude-fable-5 в своих приложениях или в Enterprise‑планах Anthropic.

Пример кода в анонсе не приводится, но логика работы такая же, как у других моделей Claude: вы выбираете claude-fable-5 как целевую модель и отправляете промпт, при этом в редких случаях ответ будет отдан через Opus 4.8, о чём Anthropic обещает явно уведомлять.


Anthropic уже готовит следующие, ещё более мощные модели. В компании обещают дорабатывать классификаторы и снижать долю ложноположительных срабатываний, чтобы Fable 5 можно было использовать шире, не теряя контроль над рисками в кибербезопасности и биологии.


Читайте также