Amazon SageMaker AI научился сам настраивать модели под ваши данные. Что это даёт — VogueTech

Что нового

Amazon добавила в SageMaker AI агент‑управляемые (agentic) рабочие процессы для кастомизации моделей. Ключевые изменения:

В SageMaker AI Studio (JupyterLab) появился интегрированный AI‑агент Kiro:
- автодополнение кода;
- отладка;
- генерация ноутбуков под вашу задачу;
- работа через чат прямо в JupyterLab.
Появились преднастроенные Skills (навыки) для настройки моделей — модульные инструкции, которые кодовый агент использует, чтобы:
- понять ваш кейс из текстового описания;
- подготовить и проверить датасет;
- выбрать технику дообучения (SFT, DPO, RLVR);
- сгенерировать training‑ и evaluation‑ноутбуки;
- развернуть модель на SageMaker AI endpoint или через Amazon Bedrock.
Поддерживаются три техники дообучения:
- SFT (Supervised Fine-Tuning) — классическое обучение по парам вход/выход;
- DPO (Direct Preference Optimization) — обучение по предпочтениям «хороший ответ / плохой ответ»;
- RLVR (Reinforcement Learning with Verifiable Rewards) — обучение с вознаграждением, которое вычисляется программно.
В SageMaker AI JupyterLab можно подключить другие ACP‑агенты:
- Claude Code (через claude-agent-acp);
- OpenCode (opencode CLI ≥ 1.0.0);
- Gemini (gemini CLI ≥ 0.34.0);
- Codex (codex-acp).
Навыки уже умеют работать с несколькими форматами данных:
- OpenAI chat формат;
- формат SageMaker AI;
- Hugging Face;
- Amazon Nova.
Пример из туториала: дообучение малой языковой модели Qwen3‑0.6B на медицинском датасете FreedomIntelligence/medical-o1-reasoning-SFT для пошагового клинического рассуждения.

Цифр по скоростям, токенам и ценам в материале нет, но есть важный момент: за счёт Skills код генерируется точечно под задачу, что снижает расход токенов по сравнению с постоянным «ручным» общением с LLM‑ассистентом.

Как это работает

Агент + Skills

Базовая идея: вы пишете в чате на естественном языке, а дальше работает связка:

Кодовый агент (Kiro, Claude Code, Cursor и т.п.) — отвечает за диалог, пишет код, задаёт уточняющие вопросы.
SageMaker AI Skills — набор markdown‑инструкций с жёсткой структурой, где зашиты:
- знание API SageMaker AI;
- типовые ML‑пайплайны;
- лучшие практики по финетюнингу и деплою;
- паттерны работы с данными и форматами.

Когда вы пишете, например: «Хочу дообучить модель для медицинского клинического рассуждения», агент:

Переходит в planning phase — не пишет код сразу, а:
- активирует нужные Skills (например, Planning, Fine-tuning Setup);
- строит многошаговый план: сбор требований → подготовка данных → обучение → оценка → деплой;
- задаёт вопросы: есть ли у вас датасет, где он лежит, какой формат, какие метрики важны.
На основе ответов выбирает:
- базовую модель из SageMaker AI Hub (например, Qwen3‑0.6B);
- технику дообучения (SFT, DPO, RLVR);
- формат данных и нужные преобразования.
Генерирует Jupyter‑ноутбуки, которые:
- запускают serverless‑training в SageMaker AI;
- логируют метрики в MLflow Apps;
- готовят код для деплоя на endpoint или в Bedrock.

Все ноутбуки — обычный Python‑код. Их можно править, коммитить в Git и встраивать в существующие ML‑пайплайны.

Какие есть Skills

SageMaker AI использует девять модульных Skills (основные из них):

Use Case Specification — помогает формализовать задачу:
- кто пользователи;
- какой бизнес‑результат;
- какие критерии успеха.
Planning — строит многошаговый план кастомизации.
Fine-tuning Setup — выбирает базовую модель из SageMaker AI Hub и технику (SFT/DPO/RLVR), настраивает гиперпараметры.
Dataset Evaluation — проверяет формат и схему датасета до запуска обучения.
Dataset Transformation — конвертирует данные между форматами (OpenAI chat, SageMaker AI, Hugging Face, Amazon Nova).
Fine-tuning — генерирует training‑ноутбуки для serverless‑finetuning в SageMaker AI.
Model Evaluation — настраивает LLM-as-a-Judge оценку (встроенные и кастомные метрики).
Model Deployment — выбирает путь деплоя (SageMaker AI endpoint или Bedrock) и генерирует код.

Skills лежат в виде markdown‑файлов в ~/.kiro/skills. Их можно редактировать, версионировать в Git и шарить внутри команды.

Поддерживаемые техники дообучения

Skills сейчас умеют три подхода и сами рекомендуют нужный на этапе планирования:

SFT (Supervised Fine-Tuning)
- Обучение на парах «вход → правильный ответ».
- Подходит для задач:
  - следование инструкциям;
  - жёсткий формат ответа;
  - адаптация к домену (медицина, юриспруденция, финансы).
DPO (Direct Preference Optimization)
- Обучение на парах «предпочитаемый ответ» vs «отклонённый ответ».
- Подходит для:
  - настройки стиля и тона;
  - согласования с человеческими предпочтениями;
  - задач, где есть субъективность.
RLVR (Reinforcement Learning with Verifiable Rewards)
- Обучение по вознаграждению, которое вычисляется кодом.
- Полезно там, где можно программно проверить корректность:
  - кодогенерация;
  - задачи с чёткими правилами и автоматической проверкой.

Интеграция с JupyterLab и ACP

В SageMaker AI Studio JupyterLab:

В правой панели есть чат, где по умолчанию активен Kiro.
Пространство (Space) автоматически подгружает SageMaker AI Skills в контекст агента.
Можно переключиться на другие ACP‑агенты (например, Claude Code) — они получат тот же доступ к Skills и AWS‑ресурсам через MCP‑серверы.

Агенты через Skills могут:

вызывать SageMaker AI API;
читать данные из Amazon S3;
работать с реестром моделей;
генерировать и запускать ноутбуки, которые вписываются в существующие ML‑пайплайны.

Что это значит для вас

Когда это реально полезно

1. Команды, которые хотят быстро запустить доменные LLM‑решения

Например:

медицинский ассистент, который объясняет клинические кейсы по шагам (как в примере с Qwen3‑0.6B и датасетом FreedomIntelligence/medical-o1-reasoning-SFT);
юр‑бот, который знает локальное законодательство и форматирует ответы под ваши шаблоны;
внутренний аналитический ассистент, который говорит на языке вашей отрасли.

Вместо того чтобы вручную собирать пайплайн «подготовка данных → обучение → оценка → деплой», вы описываете задачу в чате. Агент строит план, подбирает технику и генерирует рабочий код.

2. Разработчики, которые уже живут в JupyterLab

Если вы и так:

запускаете эксперименты в SageMaker;
пишете ноутбуки;
храните артефакты в S3 и MLflow,

то новая связка «Kiro + Skills» превращает JupyterLab в полноценную среду для полного цикла кастомизации без ручной рутины по boilerplate‑коду.

3. Команды с жёсткими требованиями к процессам и комплаенсу

Skills — это текстовые файлы. Вы можете:

зашить в них свои стандарты по подготовке данных, валидации и оценке;
потребовать обязательные шаги (например, проверка на утечки PII);
версионировать Skills в Git и накатывать их на все команды.

В итоге ассистенты перестают быть «магией», а превращаются в управляемый слой над вашим ML‑процессом.

Где это не поможет

Если у вас нет доступа к AWS или ваша инфраструктура жёстко завязана на других облаках без возможности подключить SageMaker — это решение вам не подойдёт.
Если вы не хотите работать через Jupyter/IDE и предпочитаете только UI‑консоль без кода — выгода будет меньше, потому что основная сила здесь в автогенерации и правке ноутбуков.
Если вы хотите максимально дешёвый one‑click чат‑бот, без контроля над данными, метриками и пайплайном — проще взять готовый SaaS‑конструктор.

Доступность из России

SageMaker AI Studio, Amazon Bedrock и интеграции с Anthropic и Google официально относятся к сервисам AWS. Для работы:

нужен аккаунт AWS с доступом к соответствующим регионам;
часто требуется платёжная карта, которую принимает AWS;
в ряде случаев для доступа к сопутствующим сервисам может понадобиться VPN.

Если ваша компания юридически и технически не может работать с AWS, вы не сможете использовать этот стек напрямую.

Место на рынке

Amazon здесь решает задачу не новой модели, а управляемого пайплайна кастомизации.

Что есть у конкурентов:

OpenAI предлагает fine-tuning через API для GPT‑3.5 и GPT‑4‑класса моделей, но:
- пайплайн «подготовка данных → обучение → оценка → деплой» вы собираете сами;
- нет стандартного набора Skills, который бы зашивал лучшие практики под ваш стек.
Anthropic даёт Claude Fine-Tuning и Claude Code, но фокус — на самой модели и IDE, а не на глубокой интеграции с облачной MLOps‑платформой уровня SageMaker.
Hugging Face и open source‑стек дают большую свободу, но всё придётся клеить руками: от конвертации форматов до MLflow и деплоя в прод.

SageMaker AI делает ставку на другое:

глубокая интеграция с AWS‑инфраструктурой (S3, MLflow Apps, Bedrock, SageMaker endpoints);
единый формат Skills, который можно таскать между агентами (Kiro, Claude Code, Cursor и т.д.);
поддержка сразу нескольких семейств моделей: Amazon Nova, GPT‑OSS, Llama, Qwen, DeepSeek.

Цифровых сравнений по скорости, стоимости токена или качеству дообученных моделей относительно GPT‑4o, Claude 3.5 или других игроков в материале нет. Основной акцент — на том, как быстро команда может пройти путь от идеи до прод‑модели, если уже живёт в AWS.

Установка

Запуск SageMaker AI Space с JupyterLab

Зайдите в SageMaker AI Studio.
В левом меню откройте Spaces или нажмите «Customize with agent» из Model Hub.
Далее:
- либо создайте новый Space и выберите JupyterLab как приложение;
- либо откройте существующий Space, где уже есть JupyterLab.

Kiro в таких пространствах преднастроен по умолчанию.

Как запустить Kiro в JupyterLab

Откройте правую боковую панель и нажмите на иконку чата.
В поле ввода наберите @, чтобы увидеть список доступных агентов.
Выберите @Kiro из выпадающего списка.
Начните диалог, например: I want to customize a model.

Kiro требует аутентификацию при первом запуске в Space. Процесс:

В JupyterLab откройте новый терминал: File → New → Terminal.
Выполните команду:

kiro-cli login --use-device-flow

В терминале появятся три варианта логина:
- Use for Free with Builder ID
- Use for Free with Google or GitHub
- Use with Pro license

Выберите подходящий вариант и завершите аутентификацию.

После этого можно работать с Kiro в чате.

Как подключить Claude Code в JupyterLab

SageMaker AI Studio поддерживает дополнительные coding‑агенты по Agent Control Protocol (ACP). Среди них:

Claude (через claude-agent-acp);
OpenCode (через opencode CLI ≥ 1.0.0);
Gemini (через gemini CLI ≥ 0.34.0);
Codex (через codex-acp).

Установка Claude Code

В терминале JupyterLab выполните:

npm install -g @zed-industries/claude-agent-acp

Перезапустите Space:
- либо командой в терминале:

restart-jupyter-server

либо через UI SageMaker Studio (restart Space).

Учтите: перезапуск удалит несохранённые изменения и состояние активных ядер.

Пройдите аутентификацию Claude Code по его инструкции.
В чате JupyterLab выберите агента @Claude в выпадающем списке персон.

Настройка Claude Code через Amazon Bedrock

Claude Code можно использовать через Amazon Bedrock в SageMaker AI Studio. Для этого:

Включите доступ к нужным Bedrock‑моделям и выдайте execution‑роли права:
- bedrock:InvokeModel
- bedrock:InvokeModelWithResponseStream
Создайте файл настроек для Claude Code:

~/.claude/settings.json:

{
  "env": {
    "CLAUDE_CODE_USE_BEDROCK": "1"
  }
}

После этого Claude Code будет использовать Bedrock как бэкенд для вызова моделей Claude.

Как запустить кастомизацию модели

1. Планирование через агента

В чате JupyterLab (Kiro или Claude Code) введите, например:

I want to fine-tune a model for clinical reasoning that walks through medical cases step-by-step before providing a diagnosis.

Дальше агент:

переходит в planning phase;
активирует Skills Planning и Fine-tuning Setup;
задаёт уточняющие вопросы:
- где ваш датасет;
- готов ли он к обучению;
- какие метрики важны (accuracy, reward score и т.п.).

После подтверждения плана агент:

выбирает базовую модель (в примере — Qwen3‑0.6B);
рекомендует технику (для medical‑reasoning датасета — SFT);
подбирает гиперпараметры.

2. Обучение (Fine-tune in SageMaker AI)

Агент генерирует training‑ноутбук, который:

запускает serverless‑training job в SageMaker AI;
трекает метрики обучения и валидации через SageMaker AI MLflow Apps.

Что делать вам:

Открыть сгенерированный ноутбук в JupyterLab.
Проверить код, при необходимости внести правки.
Запустить ячейки и отправить training‑job.
Следить за процессом через интерфейс SageMaker AI Studio.

По мере обучения вы увидите, как loss падает, а модель учится вести пошаговое клиническое рассуждение перед диагнозом. Для детального анализа можно открыть MLflow и посмотреть метрики по шагам.

3. Оценка модели (Evaluation)

После обучения агент предлагает стратегию оценки. Варианты:

сравнить точность на отложенном наборе medical‑reasoning вопросов;
измерить улучшение reward‑score относительно базовой модели.

Агент генерирует evaluation‑ноутбук, который:

прогоняет fine‑tuned модель по evaluation‑датасету;
рассчитывает выбранные метрики (включая LLM-as-a-Judge);
отправляет результаты в MLflow для сравнения с базовой моделью.

Вы запускаете ноутбук, получаете отчёт и решаете, достаточно ли качества для продакшена.

4. Деплой (Deployment)

Когда вы довольны качеством, агент помогает развернуть модель.

Варианты:

SageMaker AI endpoint — для низкой латентности и tight‑интеграции с AWS‑сервисами.
Amazon Bedrock через Custom Model Import — если вы хотите использовать модель как часть Bedrock‑экосистемы.

Агент генерирует ещё один ноутбук, который:

создаёт endpoint или настраивает импорт в Bedrock;
отправляет тестовый запрос к развернутой модели;
показывает пример кода для интеграции.

Вы запускаете ноутбук, проверяете inference и дальше подключаете endpoint к своим приложениям.

Кастомизация Skills

Стандартный набор Skills покрывает типовые сценарии дообучения, но вы можете:

расширить существующие Skills, например Model Evaluation, добавив:
- доменные метрики (BLEU/ROUGE для NLG, специфические медицинские или юридические показатели);
- дополнительные проверки безопасности.
написать новые Skills для своих целей:
- деплой в собственный on‑prem inference‑кластер;
- интеграция с внутренними системами логирования;
- кастомная подготовка данных.

Skills описываются в markdown‑файлах в директории:

~/.kiro/skills

Их удобно:

хранить в Git;
ревьюить через pull‑request‑ы;
раскатывать на все команды, чтобы у всех был единый «слой знаний» по ML‑процессам.

Итог

SageMaker AI с агентами и Skills превращает кастомизацию LLM‑моделей в управляемый процесс:

вы описываете задачу на естественном языке;
агент строит план, выбирает модель и технику дообучения;
генерирует ноутбуки для обучения, оценки и деплоя;
вы правите код и интегрируете его в свои пайплайны.

То, что раньше требовало месяцев работы ML‑команды с глубоким знанием SageMaker и тонкостей финетюнинга, теперь можно пройти за дни. Экспертиза упакована в Skills, процесс прозрачен, а код остаётся под вашим контролем.

Начать можно с GitHub‑репозитория плагина SageMaker AI agent skills и пошагового гида, подключить JupyterLab Space с Kiro и описать свой первый кейс в одном сообщении.