- Дата публикации
Amazon SageMaker AI научился сам настраивать модели под ваши данные. Что это даёт
Что нового
Amazon добавила в SageMaker AI агент‑управляемые (agentic) рабочие процессы для кастомизации моделей. Ключевые изменения:
- В SageMaker AI Studio (JupyterLab) появился интегрированный AI‑агент Kiro:
- автодополнение кода;
- отладка;
- генерация ноутбуков под вашу задачу;
- работа через чат прямо в JupyterLab.
- Появились преднастроенные Skills (навыки) для настройки моделей — модульные инструкции, которые кодовый агент использует, чтобы:
- понять ваш кейс из текстового описания;
- подготовить и проверить датасет;
- выбрать технику дообучения (SFT, DPO, RLVR);
- сгенерировать training‑ и evaluation‑ноутбуки;
- развернуть модель на SageMaker AI endpoint или через Amazon Bedrock.
- Поддерживаются три техники дообучения:
- SFT (Supervised Fine-Tuning) — классическое обучение по парам вход/выход;
- DPO (Direct Preference Optimization) — обучение по предпочтениям «хороший ответ / плохой ответ»;
- RLVR (Reinforcement Learning with Verifiable Rewards) — обучение с вознаграждением, которое вычисляется программно.
- В SageMaker AI JupyterLab можно подключить другие ACP‑агенты:
- Claude Code (через
claude-agent-acp); - OpenCode (
opencodeCLI ≥ 1.0.0); - Gemini (
geminiCLI ≥ 0.34.0); - Codex (
codex-acp).
- Claude Code (через
- Навыки уже умеют работать с несколькими форматами данных:
- OpenAI chat формат;
- формат SageMaker AI;
- Hugging Face;
- Amazon Nova.
- Пример из туториала: дообучение малой языковой модели Qwen3‑0.6B на медицинском датасете
FreedomIntelligence/medical-o1-reasoning-SFTдля пошагового клинического рассуждения.
Цифр по скоростям, токенам и ценам в материале нет, но есть важный момент: за счёт Skills код генерируется точечно под задачу, что снижает расход токенов по сравнению с постоянным «ручным» общением с LLM‑ассистентом.
Как это работает
Агент + Skills
Базовая идея: вы пишете в чате на естественном языке, а дальше работает связка:
- Кодовый агент (Kiro, Claude Code, Cursor и т.п.) — отвечает за диалог, пишет код, задаёт уточняющие вопросы.
- SageMaker AI Skills — набор markdown‑инструкций с жёсткой структурой, где зашиты:
- знание API SageMaker AI;
- типовые ML‑пайплайны;
- лучшие практики по финетюнингу и деплою;
- паттерны работы с данными и форматами.
Когда вы пишете, например: «Хочу дообучить модель для медицинского клинического рассуждения», агент:
- Переходит в planning phase — не пишет код сразу, а:
- активирует нужные Skills (например,
Planning,Fine-tuning Setup); - строит многошаговый план: сбор требований → подготовка данных → обучение → оценка → деплой;
- задаёт вопросы: есть ли у вас датасет, где он лежит, какой формат, какие метрики важны.
- активирует нужные Skills (например,
- На основе ответов выбирает:
- базовую модель из SageMaker AI Hub (например, Qwen3‑0.6B);
- технику дообучения (SFT, DPO, RLVR);
- формат данных и нужные преобразования.
- Генерирует Jupyter‑ноутбуки, которые:
- запускают serverless‑training в SageMaker AI;
- логируют метрики в MLflow Apps;
- готовят код для деплоя на endpoint или в Bedrock.
Все ноутбуки — обычный Python‑код. Их можно править, коммитить в Git и встраивать в существующие ML‑пайплайны.
Какие есть Skills
SageMaker AI использует девять модульных Skills (основные из них):
- Use Case Specification — помогает формализовать задачу:
- кто пользователи;
- какой бизнес‑результат;
- какие критерии успеха.
- Planning — строит многошаговый план кастомизации.
- Fine-tuning Setup — выбирает базовую модель из SageMaker AI Hub и технику (SFT/DPO/RLVR), настраивает гиперпараметры.
- Dataset Evaluation — проверяет формат и схему датасета до запуска обучения.
- Dataset Transformation — конвертирует данные между форматами (OpenAI chat, SageMaker AI, Hugging Face, Amazon Nova).
- Fine-tuning — генерирует training‑ноутбуки для serverless‑finetuning в SageMaker AI.
- Model Evaluation — настраивает LLM-as-a-Judge оценку (встроенные и кастомные метрики).
- Model Deployment — выбирает путь деплоя (SageMaker AI endpoint или Bedrock) и генерирует код.
Skills лежат в виде markdown‑файлов в ~/.kiro/skills. Их можно редактировать, версионировать в Git и шарить внутри команды.
Поддерживаемые техники дообучения
Skills сейчас умеют три подхода и сами рекомендуют нужный на этапе планирования:
- SFT (Supervised Fine-Tuning)
- Обучение на парах «вход → правильный ответ».
- Подходит для задач:
- следование инструкциям;
- жёсткий формат ответа;
- адаптация к домену (медицина, юриспруденция, финансы).
- DPO (Direct Preference Optimization)
- Обучение на парах «предпочитаемый ответ» vs «отклонённый ответ».
- Подходит для:
- настройки стиля и тона;
- согласования с человеческими предпочтениями;
- задач, где есть субъективность.
- RLVR (Reinforcement Learning with Verifiable Rewards)
- Обучение по вознаграждению, которое вычисляется кодом.
- Полезно там, где можно программно проверить корректность:
- кодогенерация;
- задачи с чёткими правилами и автоматической проверкой.
Интеграция с JupyterLab и ACP
В SageMaker AI Studio JupyterLab:
- В правой панели есть чат, где по умолчанию активен Kiro.
- Пространство (Space) автоматически подгружает SageMaker AI Skills в контекст агента.
- Можно переключиться на другие ACP‑агенты (например, Claude Code) — они получат тот же доступ к Skills и AWS‑ресурсам через MCP‑серверы.
Агенты через Skills могут:
- вызывать SageMaker AI API;
- читать данные из Amazon S3;
- работать с реестром моделей;
- генерировать и запускать ноутбуки, которые вписываются в существующие ML‑пайплайны.
Что это значит для вас
Когда это реально полезно
1. Команды, которые хотят быстро запустить доменные LLM‑решения
Например:
- медицинский ассистент, который объясняет клинические кейсы по шагам (как в примере с Qwen3‑0.6B и датасетом
FreedomIntelligence/medical-o1-reasoning-SFT); - юр‑бот, который знает локальное законодательство и форматирует ответы под ваши шаблоны;
- внутренний аналитический ассистент, который говорит на языке вашей отрасли.
Вместо того чтобы вручную собирать пайплайн «подготовка данных → обучение → оценка → деплой», вы описываете задачу в чате. Агент строит план, подбирает технику и генерирует рабочий код.
2. Разработчики, которые уже живут в JupyterLab
Если вы и так:
- запускаете эксперименты в SageMaker;
- пишете ноутбуки;
- храните артефакты в S3 и MLflow,
то новая связка «Kiro + Skills» превращает JupyterLab в полноценную среду для полного цикла кастомизации без ручной рутины по boilerplate‑коду.
3. Команды с жёсткими требованиями к процессам и комплаенсу
Skills — это текстовые файлы. Вы можете:
- зашить в них свои стандарты по подготовке данных, валидации и оценке;
- потребовать обязательные шаги (например, проверка на утечки PII);
- версионировать Skills в Git и накатывать их на все команды.
В итоге ассистенты перестают быть «магией», а превращаются в управляемый слой над вашим ML‑процессом.
Где это не поможет
- Если у вас нет доступа к AWS или ваша инфраструктура жёстко завязана на других облаках без возможности подключить SageMaker — это решение вам не подойдёт.
- Если вы не хотите работать через Jupyter/IDE и предпочитаете только UI‑консоль без кода — выгода будет меньше, потому что основная сила здесь в автогенерации и правке ноутбуков.
- Если вы хотите максимально дешёвый one‑click чат‑бот, без контроля над данными, метриками и пайплайном — проще взять готовый SaaS‑конструктор.
Доступность из России
SageMaker AI Studio, Amazon Bedrock и интеграции с Anthropic и Google официально относятся к сервисам AWS. Для работы:
- нужен аккаунт AWS с доступом к соответствующим регионам;
- часто требуется платёжная карта, которую принимает AWS;
- в ряде случаев для доступа к сопутствующим сервисам может понадобиться VPN.
Если ваша компания юридически и технически не может работать с AWS, вы не сможете использовать этот стек напрямую.
Место на рынке
Amazon здесь решает задачу не новой модели, а управляемого пайплайна кастомизации.
Что есть у конкурентов:
- OpenAI предлагает fine-tuning через API для GPT‑3.5 и GPT‑4‑класса моделей, но:
- пайплайн «подготовка данных → обучение → оценка → деплой» вы собираете сами;
- нет стандартного набора Skills, который бы зашивал лучшие практики под ваш стек.
- Anthropic даёт Claude Fine-Tuning и Claude Code, но фокус — на самой модели и IDE, а не на глубокой интеграции с облачной MLOps‑платформой уровня SageMaker.
- Hugging Face и open source‑стек дают большую свободу, но всё придётся клеить руками: от конвертации форматов до MLflow и деплоя в прод.
SageMaker AI делает ставку на другое:
- глубокая интеграция с AWS‑инфраструктурой (S3, MLflow Apps, Bedrock, SageMaker endpoints);
- единый формат Skills, который можно таскать между агентами (Kiro, Claude Code, Cursor и т.д.);
- поддержка сразу нескольких семейств моделей: Amazon Nova, GPT‑OSS, Llama, Qwen, DeepSeek.
Цифровых сравнений по скорости, стоимости токена или качеству дообученных моделей относительно GPT‑4o, Claude 3.5 или других игроков в материале нет. Основной акцент — на том, как быстро команда может пройти путь от идеи до прод‑модели, если уже живёт в AWS.
Установка
Запуск SageMaker AI Space с JupyterLab
- Зайдите в SageMaker AI Studio.
- В левом меню откройте Spaces или нажмите «Customize with agent» из Model Hub.
- Далее:
- либо создайте новый Space и выберите JupyterLab как приложение;
- либо откройте существующий Space, где уже есть JupyterLab.
Kiro в таких пространствах преднастроен по умолчанию.
Как запустить Kiro в JupyterLab
- Откройте правую боковую панель и нажмите на иконку чата.
- В поле ввода наберите
@, чтобы увидеть список доступных агентов. - Выберите
@Kiroиз выпадающего списка. - Начните диалог, например:
I want to customize a model.
Kiro требует аутентификацию при первом запуске в Space. Процесс:
- В JupyterLab откройте новый терминал: File → New → Terminal.
- Выполните команду:
kiro-cli login --use-device-flow
- В терминале появятся три варианта логина:
- Use for Free with Builder ID
- Use for Free with Google or GitHub
- Use with Pro license
Выберите подходящий вариант и завершите аутентификацию.
После этого можно работать с Kiro в чате.
Как подключить Claude Code в JupyterLab
SageMaker AI Studio поддерживает дополнительные coding‑агенты по Agent Control Protocol (ACP). Среди них:
- Claude (через
claude-agent-acp); - OpenCode (через
opencodeCLI ≥ 1.0.0); - Gemini (через
geminiCLI ≥ 0.34.0); - Codex (через
codex-acp).
Установка Claude Code
- В терминале JupyterLab выполните:
npm install -g @zed-industries/claude-agent-acp
- Перезапустите Space:
- либо командой в терминале:
restart-jupyter-server
- либо через UI SageMaker Studio (restart Space).
Учтите: перезапуск удалит несохранённые изменения и состояние активных ядер.
- Пройдите аутентификацию Claude Code по его инструкции.
- В чате JupyterLab выберите агента
@Claudeв выпадающем списке персон.
Настройка Claude Code через Amazon Bedrock
Claude Code можно использовать через Amazon Bedrock в SageMaker AI Studio. Для этого:
- Включите доступ к нужным Bedrock‑моделям и выдайте execution‑роли права:
bedrock:InvokeModelbedrock:InvokeModelWithResponseStream
- Создайте файл настроек для Claude Code:
~/.claude/settings.json:
{
"env": {
"CLAUDE_CODE_USE_BEDROCK": "1"
}
}
После этого Claude Code будет использовать Bedrock как бэкенд для вызова моделей Claude.
Как запустить кастомизацию модели
1. Планирование через агента
В чате JupyterLab (Kiro или Claude Code) введите, например:
I want to fine-tune a model for clinical reasoning that walks through medical cases step-by-step before providing a diagnosis.
Дальше агент:
- переходит в planning phase;
- активирует Skills
PlanningиFine-tuning Setup; - задаёт уточняющие вопросы:
- где ваш датасет;
- готов ли он к обучению;
- какие метрики важны (accuracy, reward score и т.п.).
После подтверждения плана агент:
- выбирает базовую модель (в примере — Qwen3‑0.6B);
- рекомендует технику (для medical‑reasoning датасета — SFT);
- подбирает гиперпараметры.
2. Обучение (Fine-tune in SageMaker AI)
Агент генерирует training‑ноутбук, который:
- запускает serverless‑training job в SageMaker AI;
- трекает метрики обучения и валидации через SageMaker AI MLflow Apps.
Что делать вам:
- Открыть сгенерированный ноутбук в JupyterLab.
- Проверить код, при необходимости внести правки.
- Запустить ячейки и отправить training‑job.
- Следить за процессом через интерфейс SageMaker AI Studio.
По мере обучения вы увидите, как loss падает, а модель учится вести пошаговое клиническое рассуждение перед диагнозом. Для детального анализа можно открыть MLflow и посмотреть метрики по шагам.
3. Оценка модели (Evaluation)
После обучения агент предлагает стратегию оценки. Варианты:
- сравнить точность на отложенном наборе medical‑reasoning вопросов;
- измерить улучшение reward‑score относительно базовой модели.
Агент генерирует evaluation‑ноутбук, который:
- прогоняет fine‑tuned модель по evaluation‑датасету;
- рассчитывает выбранные метрики (включая LLM-as-a-Judge);
- отправляет результаты в MLflow для сравнения с базовой моделью.
Вы запускаете ноутбук, получаете отчёт и решаете, достаточно ли качества для продакшена.
4. Деплой (Deployment)
Когда вы довольны качеством, агент помогает развернуть модель.
Варианты:
- SageMaker AI endpoint — для низкой латентности и tight‑интеграции с AWS‑сервисами.
- Amazon Bedrock через Custom Model Import — если вы хотите использовать модель как часть Bedrock‑экосистемы.
Агент генерирует ещё один ноутбук, который:
- создаёт endpoint или настраивает импорт в Bedrock;
- отправляет тестовый запрос к развернутой модели;
- показывает пример кода для интеграции.
Вы запускаете ноутбук, проверяете inference и дальше подключаете endpoint к своим приложениям.
Кастомизация Skills
Стандартный набор Skills покрывает типовые сценарии дообучения, но вы можете:
- расширить существующие Skills, например
Model Evaluation, добавив:- доменные метрики (BLEU/ROUGE для NLG, специфические медицинские или юридические показатели);
- дополнительные проверки безопасности.
- написать новые Skills для своих целей:
- деплой в собственный on‑prem inference‑кластер;
- интеграция с внутренними системами логирования;
- кастомная подготовка данных.
Skills описываются в markdown‑файлах в директории:
~/.kiro/skills
Их удобно:
- хранить в Git;
- ревьюить через pull‑request‑ы;
- раскатывать на все команды, чтобы у всех был единый «слой знаний» по ML‑процессам.
Итог
SageMaker AI с агентами и Skills превращает кастомизацию LLM‑моделей в управляемый процесс:
- вы описываете задачу на естественном языке;
- агент строит план, выбирает модель и технику дообучения;
- генерирует ноутбуки для обучения, оценки и деплоя;
- вы правите код и интегрируете его в свои пайплайны.
То, что раньше требовало месяцев работы ML‑команды с глубоким знанием SageMaker и тонкостей финетюнинга, теперь можно пройти за дни. Экспертиза упакована в Skills, процесс прозрачен, а код остаётся под вашим контролем.
Начать можно с GitHub‑репозитория плагина SageMaker AI agent skills и пошагового гида, подключить JupyterLab Space с Kiro и описать свой первый кейс в одном сообщении.