- Дата публикации
Mistral выпускает Devstral 2 и Vibe CLI: открытый ИИ-помощник для программистов
Что появилось / что изменилось
Mistral представила новое семейство кодовых моделей Devstral 2 и нативный терминальный ассистент Mistral Vibe CLI.
Главные новинки:
-
Devstral 2 (123B)
- 123 млрд параметров, плотный трансформер
- Контекст: 256K токенов
- Результат на SWE-bench Verified — 72,2%
- Открытые веса, лицензия — модифицированная MIT
- Сейчас бесплатно по API, позже — $0,40 / $2,00 за миллион токенов (ввод / вывод)
-
Devstral Small 2 (24B)
- 24 млрд параметров, тот же контекст 256K
- 68,0% на SWE-bench Verified
- Открытые веса, лицензия Apache 2.0
- Доступен по API и для локального развёртывания на потребительском железе
- Планируемая цена по API — $0,10 / $0,30 за миллион токенов (ввод / вывод)
- Поддерживает картинки и может работать как мультимодальный агент
-
Размер относительно конкурентов
- Devstral 2 и Devstral Small 2:
- 5× и 28× меньше DeepSeek V3.2
- 8× и 41× меньше Kimi K2
- При этом Devstral Small 2 по качеству держится рядом с моделями, которые в 5 раз больше.
- Devstral 2 и Devstral Small 2:
-
Производительность и стоимость
- Devstral 2 на реальных задачах разработки до 7 раз дешевле, чем Claude Sonnet 4.5
- В человеческих оценках Devstral 2 выигрывает у DeepSeek V3.2 в 42,8% случаев и проигрывает в 28,6%, но Claude Sonnet 4.5 всё ещё заметно лучше.
-
Mistral Vibe CLI
- Открытый CLI-ассистент для кода под Apache 2.0
- Работает поверх Devstral, общается на естественном языке, меняет файлы, запускает команды
- Поддерживает интеграцию с IDE через Agent Communication Protocol.
Как это работает
Devstral 2 — это плотный трансформер на 123B параметров с большим контекстом 256K. Такой размер позволяет держать в памяти не только один файл, а существенную часть репозитория.
Модель умеет:
- анализировать структуру проекта и зависимостей фреймворков
- отслеживать изменения в нескольких файлах сразу
- ловить ошибки, перезапускать попытки и вносить исправления
- работать с крупными монорепами и легаси-кодом.
Devstral Small 2 повторяет архитектурный подход, но в 24B параметров, поэтому:
- его можно крутить локально на мощном ноутбуке или десктопе
- время отклика ниже, чем у 123B-версии
- он подходит для дообучения под конкретный стек или кодовую базу.
Обе модели поддерживают тонкую настройку: можно сделать версию, которая приоритетит, например, Python или Java, или оптимизировать под внутренний корпоративный репозиторий.
Mistral Vibe CLI подключается к Devstral и превращает его в терминального агента:
- сканирует файловую структуру и
git status, чтобы понимать контекст проекта - даёт чат-интерфейс с инструментами для работы с файлами, поиска по коду, git-операций и запуска команд
- умеет оркестрировать правки в нескольких файлах сразу, а не только в текущем.
Vibe CLI хранит историю, поддерживает автодополнение и темы оформления. Конфигурация через config.toml: можно указать локальные модели, провайдеров, права на выполнение команд и файловые операции.
Что это значит для вас
Если вы пишете код каждый день, Devstral 2 и Vibe CLI — это в первую очередь автоматизация рутины:
Когда полезно:
-
Поддержка и рефакторинг крупных проектов
256K контекста позволяют загрузить в модель большие фрагменты репозитория. Devstral может сам искать, где нужно поправить код, и вносить серию согласованных изменений. -
Фикс багов и работа с легаси
Модель отслеживает зависимости и умеет повторять попытки с исправлениями. Это удобно для сложных багрепортов, которые затрагивают несколько модулей. -
Быстрая разработка прототипов и внутренних тулов
Devstral Small 2 можно развернуть локально и использовать как приватного ассистента без слива кода в облако. -
Мультимодальные агенты
Devstral Small 2 принимает изображения, поэтому можно строить агентов, которые анализируют скриншоты интерфейсов, диаграммы или схемы и генерируют код. -
Работа из терминала
Vibe CLI подойдёт, если вы живёте в tmux и Vim. Он понимает структуру проекта, умеет коммитить, запускать тесты и править файлы по диалогу.
Когда аккуратнее:
-
Критические продовые изменения
Как и любому кодовому ассистенту, Devstral нельзя доверять без ревью. Он ошибается реже, чем многие открытые модели, но Claude Sonnet 4.5 по качеству всё ещё лучше. -
Проекты с жёсткими регуляторными требованиями
Если нельзя выносить код за контур, смотрите в сторону локального Devstral Small 2 и внимательно читайте лицензию (модифицированная MIT для Devstral 2, Apache 2.0 для Small и Vibe). -
Доступ из России
Официально Mistral не таргетирует российский рынок. Для доступа к API и сервисам, скорее всего, понадобится VPN и зарубежный платёжный метод.
Практический минимум: если вы уже пользуетесь GitHub Copilot, GPT-4o или Claude Sonnet 4.5, Devstral имеет смысл как дополнительный инструмент — особенно в связке с Vibe CLI и локальными развёртываниями.
Место на рынке
По открытым данным Devstral 2 и Devstral Small 2 сейчас выглядят так:
-
Качество на коде
- Devstral 2: 72,2% SWE-bench Verified
- Devstral Small 2: 68,0% SWE-bench Verified
Это ставит их в один ряд с лучшими открытыми моделями для кода.
-
Размер против DeepSeek V3.2 и Kimi K2
- Devstral 2 / Small 2:
- 5× и 28× меньше DeepSeek V3.2
- 8× и 41× меньше Kimi K2
При этом Small 2 по качеству сопоставим с моделями, которые в 5 раз тяжелее.
- Devstral 2 / Small 2:
-
Сравнение с Claude Sonnet 4.5
- По человеческим оценкам разработчики чаще выбирают Claude Sonnet 4.5, чем Devstral 2
- Но Devstral 2 на реальных задачах разработки до 7 раз дешевле, чем Claude Sonnet 4.5
- Если вам важен максимум качества — закрытая модель Anthropic всё ещё впереди. Если важна стоимость и открытые веса — Devstral 2 интереснее.
-
Сравнение с другими открытыми решениями
- На фоне крупных открытых моделей Devstral 2 показывает один из лучших результатов на SWE-bench Verified
- При этом остаётся относительно компактным, что упрощает развёртывание и снижает стоимость.
Mistral уже интегрировала Devstral 2 с инструментами Kilo Code и Cline, так что модель можно попробовать прямо в привычных агентных окружениях. Для разработчиков это шанс получить открытый кодовый ассистент с сильной поддержкой агентных сценариев и большим контекстом, не запираясь на одном вендоре.