- Дата публикации
Anthropic запустила Claude 3.5 Sonnet и Artifacts: быстрый ИИ‑ассистент с рабочим пространством
Что нового
Anthropic представила Claude 3.5 Sonnet — первую модель в линейке Claude 3.5.
Ключевые факты:
- Производительность:
- Обходит Claude 3 Opus по ряду бенчмарков:
- GPQA — задачи на «магистерское» рассуждение
- MMLU — «бакалаврские» знания по широкому набору дисциплин
- HumanEval — качество кода
- Внутренний тест на «агентное» программирование:
- Claude 3.5 Sonnet решает 64% задач
- Claude 3 Opus решает 38% задач
- Обходит Claude 3 Opus по ряду бенчмарков:
- Скорость и цена:
- Работает примерно в 2 раза быстрее, чем Claude 3 Opus
- Цена через API: $3 за 1 млн входных токенов и $15 за 1 млн выходных токенов
- Контекст: до 200 000 токенов в одном запросе
- Доступность:
- Бесплатно на Claude.ai и в приложении Claude для iOS
- Повышенные лимиты для подписок Claude Pro и Team
- Доступен через Anthropic API, Amazon Bedrock и Google Cloud Vertex AI
- Визуальные возможности:
- Лучшая на сегодня «зрительная» модель Anthropic
- Лучше Claude 3 Opus на стандартных vision‑бенчмарках
- Умеет читать текст с «шумных» картинок и проводить визуальное рассуждение по графикам и диаграммам
- Новая функция Artifacts:
- На Claude.ai появляется отдельное окно‑рабочее пространство
- Туда выводятся сгенерированные кодовые сниппеты, тексты, макеты сайтов и другие артефакты
- Пользователь может сразу редактировать и дорабатывать результат вместе с Claude
- Безопасность и приватность:
- Уровень безопасности по внутренней шкале Anthropic: ASL‑2
- Модель проверили UK AI Safety Institute и поделились результатами с US AI Safety Institute
- Anthropic не использует пользовательский контент для обучения без явного согласия
Позже в этом году Anthropic планирует выпустить ещё две модели в линейке: Claude 3.5 Haiku и Claude 3.5 Opus.
Как это работает
Anthropic не раскрывает архитектуру Claude 3.5 Sonnet, но по описанию можно понять несколько вещей о том, как устроен продукт.
-
Большой контекст — до 200K токенов
Claude 3.5 Sonnet может держать в памяти длинные документы, переписки и кодовые базы. 200 000 токенов — это сотни страниц текста или крупный репозиторий кода. Это важно для сценариев вроде анализа договоров, ревью монорепозитория или сложных цепочек писем. -
«Агентное» программирование
Anthropic тестирует модель в режиме, где Claude не просто выдаёт кусок кода, а:- получает задачу на естественном языке (например, «исправь баг» или «добавь фичу» в open source‑проекте)
- сам использует инструменты: редактирует файлы, запускает код, проверяет результат
- повторяет цикл, пока не добьётся нужного поведения
По внутреннему тесту Claude 3.5 Sonnet успешно закрывает 64% таких задач, что заметно выше, чем у Claude 3 Opus (38%).
-
Vision‑часть
Claude 3.5 Sonnet умеет работать с изображениями не только как с картинками, но и как с источником структурированной информации:- интерпретирует графики, диаграммы, таблицы в картинках
- распознаёт текст, даже если фото сделано «на бегу» и с искажениями
- сопоставляет визуальные элементы с текстовым запросом (например, «объясни, что происходит на этом графике прибыли по кварталам»)
-
Artifacts — надстройка над диалогом
На уровне интерфейса Claude.ai Anthropic добавила режим, где результат запроса живёт не в переписке, а в отдельной панели:- Запрос: «Сгенерируй лендинг для продукта X на HTML/CSS»
- Claude создаёт «артефакт» — файл с кодом или текстом
- Артефакт открывается в правой панели, где его можно редактировать, а Claude — дорабатывать по вашим комментариям
Это превращает Claude из «чата» в рабочее пространство: диалог слева, рабочий файл справа.
-
Безопасность и политика использования
Anthropic:- проводит внутренний и внешний red teaming (поиск способов злоупотреблений)
- получает обратную связь от сторонних экспертов, в том числе по детской безопасности (организация Thorn помогла обновить классификаторы)
- использует эту обратную связь для обновления политик и фильтров вокруг Claude 3.5 Sonnet
Что это значит для вас
Где Claude 3.5 Sonnet будет полезен
-
Разработка и сопровождение кода
- Быстрая генерация функций, классов, тестов
- Поиск и исправление багов по описанию ошибки и фрагменту кода
- Миграции и рефакторинг: модель уверенно переводит код между языками и фреймворками
- Работа с легаси‑системами: можно загрузить большие куски старого кода и постепенно их модернизировать
Агентный сценарий (когда Claude получает доступ к инструментам) особенно интересен для внутренних DevTools: модель может сама править файлы и запускать тесты.
-
Продвинутый customer support и операционные процессы
За счёт большого контекста и высокой скорости Claude 3.5 Sonnet подходит для:
- сложной поддержки клиентов, где нужно учитывать длинную историю обращений и документацию
- оркестрации многошаговых процессов: отбор заявок, проверка условий, подготовка писем и отчётов
Здесь важно, что Anthropic позиционирует Sonnet как «средний» по цене и мощности вариант, но с производительностью уровня старших моделей.
-
Контент и коммуникации
Claude 3.5 Sonnet лучше понимает:
- нюансы формулировок
- юмор
- сложные инструкции
Это полезно, если вы пишете:
- длинные статьи, обзоры, рассылки
- сценарии, презентации, лендинги
Модель умеет держать «естественный» тон, ближе к живой речи, а не к канцеляриту.
-
Работа с изображениями и документами
Если у вас много сканов, фото документов, графиков из отчётов, Claude 3.5 Sonnet может:
- вытаскивать текст из «шумных» картинок
- объяснять, что показано на графике или диаграмме
- комбинировать визуальную и текстовую информацию в одном ответе
Это может пригодиться ритейлу, логистике, финтеху — везде, где информация живёт не только в текстовых файлах.
-
Совместная работа через Artifacts
Artifacts превращают Claude.ai в лёгкий рабочий IDE/редактор в браузере:
- вы видите код или документ в отдельной панели
- можете править его руками
- параллельно обсуждаете изменения с Claude в чате
Это удобно для быстрого прототипирования сайтов, интерфейсов, текстов документов и шаблонов.
Где Claude 3.5 Sonnet не подойдёт
-
Критически важные решения без верификации
Несмотря на высокий уровень безопасности (ASL‑2) и тесты со стороны UK/US AI Safety Institute, модель всё ещё может ошибаться, «галлюцинировать» факты или неправильно интерпретировать данные. Для юриспруденции, медицины, финансовых решений высокого риска нужен обязательный человеческий контроль. -
Сценарии, где важна полная офлайн‑работа
Claude 3.5 Sonnet — облачный сервис. Если вам нужен ИИ, который работает полностью локально, без отправки данных на сервера, придётся искать другие решения. -
Пользователи из России
Официальный сайт Claude.ai и приложение Claude для iOS могут быть недоступны из России без VPN или других способов обхода ограничений. Для использования API через Anthropic, Amazon Bedrock или Google Cloud Vertex AI также нужны аккаунты в этих сервисах и соблюдение их юридических требований.
Место на рынке
Anthropic позиционирует Claude 3.5 Sonnet как «средний» по цене и мощности вариант в линейке, но по ряду задач он уже обгоняет старший Claude 3 Opus.
Что можно сказать по фактам из анонса:
-
Против Claude 3 Opus:
- Claude 3.5 Sonnet быстрее примерно в 2 раза
- Лучше показывает себя на GPQA, MMLU и HumanEval
- В агентном кодинге закрывает 64% задач против 38% у Opus
- При этом стоит как прежний «средний» Sonnet: $3 за 1 млн входных токенов и $15 за 1 млн выходных
Для бизнеса это означает: можно получить производительность уровня старшего флагмана по цене и скорости среднего тарифа.
-
Против других игроков:
- Anthropic прямо заявляет, что Claude 3.5 Sonnet опережает «конкурентные модели» на ряде бенчмарков, но без конкретных названий и цифр сравнения.
- По факту, это сигнал, что Anthropic целится в тот же класс, где сейчас играют флагманские модели других вендоров, и делает ставку на скорость + разумную цену.
Если вы уже используете Claude 3 Sonnet через API или Claude.ai, переход на 3.5‑версию выглядит логичным апгрейдом: выше качество, та же ценовая категория, больше возможностей для кода и картинок.
Как запустить
Через веб‑интерфейс Claude.ai
- Откройте сайт Claude.ai в браузере.
- Авторизуйтесь или создайте аккаунт.
- В списке доступных моделей выберите Claude 3.5 Sonnet.
- Для работы с Artifacts:
- сформулируйте задачу, которая предполагает артефакт (код, текстовый документ, дизайн сайта и т.п.)
- после ответа Claude справа появится панель с артефактом, который можно редактировать
Доступ к Claude.ai из России может требовать VPN.
Через приложение Claude для iOS
- Установите приложение Claude из App Store.
- Войдите в аккаунт.
- В настройках чата или выпадающем списке моделей выберите Claude 3.5 Sonnet.
- Используйте его как обычного чат‑ассистента, с поддержкой тех же возможностей, что и в вебе (с учётом ограничений мобильного интерфейса).
Через API Anthropic
- Подключение идёт через стандартный Anthropic API.
- Тарифы для Claude 3.5 Sonnet: $3 за 1 млн входных токенов и $15 за 1 млн выходных токенов.
- Максимальный контекст: 200K токенов.
Конкретные примеры кода в анонсе не приводятся, но если вы уже интегрировали Claude 3 Sonnet, переход на 3.5 обычно сводится к смене имени модели в параметрах запроса.
Безопасность и приватность
Anthropic делает несколько важных акцентов, которые важны для корпоративных пользователей:
-
Уровень безопасности ASL‑2
Внутренняя шкала Anthropic (AI Safety Level) показывает, какие типы рисков модель может создавать. Claude 3.5 Sonnet остаётся на уровне ASL‑2, несмотря на рост интеллекта. -
Внешние проверки
Anthropic передала Claude 3.5 Sonnet в UK AI Safety Institute для оценки перед запуском. Результаты тестов UK AISI поделились с US AI Safety Institute в рамках соглашения между институтами. -
Работа с экспертами по безопасности
Anthropic привлекает внешних специалистов, в том числе организацию Thorn, чтобы обновлять классификаторы и политики по детской безопасности и другим типам злоупотреблений. -
Приватность данных
Один из принципов «конституции» Anthropic: не использовать пользовательский контент для обучения без явного согласия. Это важно для компаний, которые боятся утечек данных через облачные ИИ‑сервисы.
Что дальше
Anthropic планирует:
- дополнить линейку Claude 3.5 моделями Claude 3.5 Haiku и Claude 3.5 Opus позже в этом году
- развивать новые модальности и функции для бизнеса, включая интеграции с корпоративными приложениями
- добавить Memory — возможность для Claude помнить предпочтения и историю взаимодействий пользователя (по явному запросу), чтобы делать опыт более персонализированным
- расширить Claude.ai до полноценного пространства для командной работы: общие документы, знания и проекты с Claude как «тиммейтом по запросу»
Пользователи могут отправлять фидбек по Claude 3.5 Sonnet прямо в интерфейсе, и Anthropic обещает учитывать его в дорожной карте развития.