Дата публикации
ai_products

MiniMax M2.7: открытый ИИ, который сам улучшает себя и пишет продакшн‑код

Что нового

MiniMax выложила в открытый доступ MiniMax M2.7 — крупную языковую модель, которая участвовала в собственном обучении и донастройке.

Ключевые факты и цифры:

  • Самоэволюция модели: внутренняя версия M2.7 сама оптимизировала программный «скелет» более чем в 100 раундов. Анализировала неудачные запуски, правила код, гоняла оценки, откатывала или принимала изменения. Итог — +30% к производительности в этой задаче.
  • Успехи в ML‑соревнованиях: на MLE Bench Lite (22 соревнования по машинному обучению) M2.7 получила 66,6% медалей. Выше только Opus‑4.6 и GPT‑5.4.
  • Инженерия ПО:
    • SWE‑Pro: 56,22%, на уровне GPT‑5.3‑Codex.
    • SWE Multilingual: 76,5.
    • Multi SWE Bench: 52,7.
    • VIBE‑Pro: 55,6%, почти как Opus 4.6.
    • Terminal Bench 2: 57,0%.
    • NL2Repo: 39,8%.
  • Продакшн‑инциденты: команда MiniMax с помощью M2.7 несколько раз сокращала время восстановления живых сервисов до менее трёх минут.
  • Офисные задачи: на GDPval‑AA M2.7 набрала ELO 1495 — самый высокий результат среди открытых моделей, выше GPT‑5.3. Модель уверенно работает с Word, Excel, PowerPoint, поддерживает многошаговое редактирование с сохранением форматирования и даёт на выходе редактируемые файлы.
  • Инструменты и навыки:
    • Toolathon: 46,3% точности (глобальный топ‑уровень).
    • MM Claw: 97% соблюдения инструкций по более чем 40 сложным навыкам.
    • MM Claw end‑to‑end: 62,7%, близко к Sonnet 4.6.
  • Мультиагентность: встроенная поддержка Agent Teams — несколько агентов с устойчивыми ролями и автономным принятием решений.
  • Развлечения: улучшена эмоциональная выразительность и сохранение характера. Параллельно MiniMax открыла OpenRoom — веб‑демо с графическим интерфейсом и интерактивной сценой: https://openroom.ai.
  • Открытый доступ: веса лежат на Hugging Face — https://huggingface.co/MiniMaxAI/MiniMax-M2.7 и на ModelScope; есть вариант через NVIDIA NIM Endpoint.

Как это работает

Самоэволюция MiniMax M2.7

MiniMax использует M2.7 не только как готовый продукт, но и как участника собственного обучения.

Во время разработки команда дала модели доступ к:

  • собственной «памяти» (внутреннему хранилищу знаний и опыта);
  • системе навыков (Skills), которые можно создавать и донастраивать;
  • результатам экспериментов по обучению с подкреплением (RL).

M2.7 сама:

  1. Создавала десятки сложных навыков для RL‑экспериментов.
  2. Обновляла свою память на основе новых задач и результатов.
  3. Меняла процесс обучения, опираясь на то, какие подходы давали лучший результат.

Отдельный пример — оптимизация программного «скелета» (scaffold) для задач программирования:

  • Модель запускала код, анализировала, где и почему он ломается.
  • Меняла архитектуру и фрагменты кода.
  • Прогоняла новые версии через бенчмарки.
  • Решала, оставить изменения или откатить.

Более 100 таких циклов дали 30% прирост производительности в этой области.

Глубокое понимание инженерных систем

M2.7 обучили не только на чистом коде, но и на сценариях реальной эксплуатации сервисов. Отсюда — акцент на системном мышлении:

  • анализ логов и трассировок;
  • сопоставление метрик мониторинга из разных источников;
  • проверка гипотез о корневой причине инцидента в базах данных;
  • принятие решений уровня SRE: что перезапустить, что откатить, где изменить конфигурацию.

Это не просто автодополнение кода, а агент, который может вести себя как инженер поддержки продакшена.

Агентные команды и навыки

MiniMax встроила в M2.7 поддержку Agent Teams:

  • несколько агентов с разными ролями (например, «backend‑инженер», «аналитик данных», «ревьюер безопасности»);
  • стабильная идентичность ролей — каждый агент помнит свою зону ответственности;
  • автономное распределение задач и принятие решений внутри команды.

Отдельная подсистема — Skills:

  • навыки описывают сложные цепочки действий (например, «диагностика инцидента в продакшене», «подготовка отчёта в PowerPoint»);
  • M2.7 сама помогала создавать такие навыки и тестировать их в RL‑экспериментах;
  • на бенчмарке MM Claw модель соблюдает инструкции по этим навыкам в 97% случаев.

Работа с инструментами и документами

M2.7 умеет вызывать внешние инструменты (Tool Calling) и работать с файлами:

  • редактировать Word‑документы с сохранением стилей и структуры;
  • строить и править Excel‑таблицы и формулы;
  • собирать презентации PowerPoint, а затем вносить правки несколькими итерациями.

На бенчмарке Toolathon модель показывает 46,3% точности при работе с инструментами, а на GDPval‑AA набирает ELO 1495, что выше GPT‑5.3 среди открытых решений.

Что это значит для вас

Кому MiniMax M2.7 действительно полезна

1. Разработчики и SRE‑команды

M2.7 пригодится, если вы:

  • разбираете сложные инциденты в продакшене;
  • исследуете логи и трассировки из нескольких систем мониторинга;
  • чините баги в распределённых сервисах;
  • занимаетесь рефакторингом и безопасностью кода.

MiniMax сама использует M2.7 для живых инцидентов и несколько раз снижала время восстановления до менее трёх минут. Это сильный аргумент, если вы ищете ассистента для on‑call‑дежурств и разборов постмортемов.

2. Команды машинного обучения и data‑science

На MLE Bench Lite M2.7 взяла 66,6% медалей на 22 соревнованиях. Это значит, что модель:

  • понимает постановки задач из ML‑соревнований;
  • умеет строить рабочие пайплайны для обучения моделей;
  • может помогать в настройке экспериментов и анализе метрик.

Если вы участвуете в ML‑соревнованиях или строите внутренние бенчмарки, M2.7 — хороший кандидат в «второго пилота».

3. Продакт‑менеджеры, аналитики, офисные сотрудники

Благодаря сильным результатам на GDPval‑AA и поддержке Word/Excel/PPT модель подойдёт для:

  • подготовки отчётов и презентаций с несколькими итерациями правок;
  • сводных таблиц и первичного анализа данных в Excel;
  • редактирования документов с учётом стиля и структуры.

M2.7 умеет не только сгенерировать черновик, но и вносить точечные изменения по комментариям, не ломая форматирование.

4. Создатели игр, интерактивных приложений и контента

У модели усилены эмоциональный интеллект и стабильность персонажей. Вместе с этим MiniMax открыла OpenRoom — веб‑сцену, где можно строить интерактивные взаимодействия с ИИ в графическом интерфейсе.

Если вы делаете:

  • прототипы игр с живыми NPC;
  • интерактивные истории;
  • обучающие симуляции — M2.7 и OpenRoom дадут удобную площадку для экспериментов.

Где MiniMax M2.7 не лучшая идея

  • Критичные юридические и медицинские решения. Модель сильна в инженерии и офисных задачах, но не предназначена для принятия решений с юридическими или медицинскими рисками.
  • Проекты, где нужен закрытый корпоративный хостинг без внешних зависимостей. M2.7 можно развернуть локально, но вам придётся самостоятельно решать вопросы инфраструктуры, безопасности и соответствия требованиям регуляторов.
  • Сценарии, где важна минимальная задержка и жёсткие SLA. Веса открыты, но конечная скорость и стабильность зависят от того, как вы настроите SGLang/vLLM/Transformers и железо.

Доступность из России

MiniMax распространяет M2.7 через Hugging Face, ModelScope и NVIDIA NIM Endpoint. Доступ к этим сервисам может быть ограничен или нестабилен в зависимости от юрисдикции и политики провайдеров. В ряде случаев для скачивания весов или работы с облачными endpoint’ами понадобится VPN и собственная инфраструктура для развёртывания.

Место на рынке

По открытым бенчмаркам M2.7 занимает заметную позицию среди открытых и закрытых моделей.

Сравнение с закрытыми моделями

  • MLE Bench Lite: M2.7 — 66,6% медалей, уступает только Opus‑4.6 и GPT‑5.4.
  • VIBE‑Pro: 55,6%, почти на уровне Opus 4.6.
  • MM Claw end‑to‑end: 62,7%, близко к Sonnet 4.6.

По инженерным и агентным бенчмаркам M2.7 уже играет в одной лиге с крупными закрытыми моделями, хотя прямых цифр по скорости и стоимости запросов MiniMax не раскрывает.

Сравнение с открытыми моделями

  • На GDPval‑AA M2.7 получила ELO 1495 — выше GPT‑5.3 среди открытых решений.
  • На SWE‑Pro результат 56,22%, сопоставим с GPT‑5.3‑Codex.
  • На Toolathon46,3% точности, что относит модель к верхнему эшелону по работе с инструментами.

С учётом открытых весов и сильных инженерных метрик M2.7 выглядит как одна из наиболее мощных опций для тех, кто хочет развернуть модель у себя и не зависеть целиком от API крупных провайдеров.

Установка

MiniMax предлагает несколько путей развёртывания M2.7 — от локального запуска до облачных endpoint’ов.

Локальное развёртывание

Скачать модель можно с Hugging Face:

  • https://huggingface.co/MiniMaxAI/MiniMax-M2.7

MiniMax рекомендует следующие фреймворки для инференса (по алфавиту):

SGLang

Рекомендованный вариант для сервинга MiniMax‑M2.7.

Подробная инструкция: SGLang Deployment Guide (ссылка у MiniMax в документации).

vLLM

Альтернативный высокопроизводительный сервер инференса.

Подробная инструкция: vLLM Deployment Guide.

Transformers

Для интеграции в существующие пайплайны на базе Hugging Face Transformers.

Подробная инструкция: Transformers Deployment Guide.

ModelScope

Весы MiniMax‑M2.7 также доступны через ModelScope.

NVIDIA NIM Endpoint

Если вы не хотите поднимать собственный сервер, MiniMax M2.7 есть в виде NVIDIA NIM Endpoint. Это удобный вариант, если ваша инфраструктура уже крутится вокруг решений NVIDIA.

Рекомендованные параметры инференса

MiniMax советует использовать такие настройки для лучшего качества ответов:

  • temperature = 1.0
  • top_p = 0.95
  • top_k = 40

Стандартный системный промпт:

You are a helpful assistant. Your name is MiniMax-M2.7 and is built by MiniMax.

Как запустить

Ниже — базовый сценарий, как можно встроить M2.7 в свой стек (общая логика, без привязки к конкретной библиотеке, так как MiniMax даёт только ссылки на гайды):

  1. Скачайте веса с Hugging Face или ModelScope.
  2. Поднимите сервер инференса на SGLang, vLLM или Transformers по официальному гайду.
  3. Задайте системный промпт и параметры инференса:
    • temperature=1.0, top_p=0.95, top_k=40.
  4. Подключите модель к вашим инструментам через механизм Tool Calling.

Руководство по Tool Calling MiniMax вынесла в отдельный документ — Tool Calling Guide.

Контакты и документация

  • Репозиторий модели: https://huggingface.co/MiniMaxAI/MiniMax-M2.7
  • Демонстрация OpenRoom: https://openroom.ai
  • Руководства по развёртыванию: SGLang / vLLM / Transformers Deployment Guides (на сайте MiniMax)
  • Руководство по Tool Calling: Tool Calling Guide
  • Обратная связь: model@minimax.io

Если вам нужна сильная открытая модель для инженерных задач, работы с документами и экспериментов с агентами, MiniMax M2.7 — один из самых интересных вариантов, которые сейчас можно развернуть у себя.


Читайте также