Дата публикации
ai_products

Amazon SageMaker AI научился сам настраивать модели под ваши данные. Что это даёт

Что нового

Amazon добавила в SageMaker AI агент‑управляемые (agentic) рабочие процессы для кастомизации моделей. Ключевые изменения:

  • В SageMaker AI Studio (JupyterLab) появился интегрированный AI‑агент Kiro:
    • автодополнение кода;
    • отладка;
    • генерация ноутбуков под вашу задачу;
    • работа через чат прямо в JupyterLab.
  • Появились преднастроенные Skills (навыки) для настройки моделей — модульные инструкции, которые кодовый агент использует, чтобы:
    • понять ваш кейс из текстового описания;
    • подготовить и проверить датасет;
    • выбрать технику дообучения (SFT, DPO, RLVR);
    • сгенерировать training‑ и evaluation‑ноутбуки;
    • развернуть модель на SageMaker AI endpoint или через Amazon Bedrock.
  • Поддерживаются три техники дообучения:
    • SFT (Supervised Fine-Tuning) — классическое обучение по парам вход/выход;
    • DPO (Direct Preference Optimization) — обучение по предпочтениям «хороший ответ / плохой ответ»;
    • RLVR (Reinforcement Learning with Verifiable Rewards) — обучение с вознаграждением, которое вычисляется программно.
  • В SageMaker AI JupyterLab можно подключить другие ACP‑агенты:
    • Claude Code (через claude-agent-acp);
    • OpenCode (opencode CLI ≥ 1.0.0);
    • Gemini (gemini CLI ≥ 0.34.0);
    • Codex (codex-acp).
  • Навыки уже умеют работать с несколькими форматами данных:
    • OpenAI chat формат;
    • формат SageMaker AI;
    • Hugging Face;
    • Amazon Nova.
  • Пример из туториала: дообучение малой языковой модели Qwen3‑0.6B на медицинском датасете FreedomIntelligence/medical-o1-reasoning-SFT для пошагового клинического рассуждения.

Цифр по скоростям, токенам и ценам в материале нет, но есть важный момент: за счёт Skills код генерируется точечно под задачу, что снижает расход токенов по сравнению с постоянным «ручным» общением с LLM‑ассистентом.

Как это работает

Агент + Skills

Базовая идея: вы пишете в чате на естественном языке, а дальше работает связка:

  • Кодовый агент (Kiro, Claude Code, Cursor и т.п.) — отвечает за диалог, пишет код, задаёт уточняющие вопросы.
  • SageMaker AI Skills — набор markdown‑инструкций с жёсткой структурой, где зашиты:
    • знание API SageMaker AI;
    • типовые ML‑пайплайны;
    • лучшие практики по финетюнингу и деплою;
    • паттерны работы с данными и форматами.

Когда вы пишете, например: «Хочу дообучить модель для медицинского клинического рассуждения», агент:

  1. Переходит в planning phase — не пишет код сразу, а:
    • активирует нужные Skills (например, Planning, Fine-tuning Setup);
    • строит многошаговый план: сбор требований → подготовка данных → обучение → оценка → деплой;
    • задаёт вопросы: есть ли у вас датасет, где он лежит, какой формат, какие метрики важны.
  2. На основе ответов выбирает:
    • базовую модель из SageMaker AI Hub (например, Qwen3‑0.6B);
    • технику дообучения (SFT, DPO, RLVR);
    • формат данных и нужные преобразования.
  3. Генерирует Jupyter‑ноутбуки, которые:
    • запускают serverless‑training в SageMaker AI;
    • логируют метрики в MLflow Apps;
    • готовят код для деплоя на endpoint или в Bedrock.

Все ноутбуки — обычный Python‑код. Их можно править, коммитить в Git и встраивать в существующие ML‑пайплайны.

Какие есть Skills

SageMaker AI использует девять модульных Skills (основные из них):

  • Use Case Specification — помогает формализовать задачу:
    • кто пользователи;
    • какой бизнес‑результат;
    • какие критерии успеха.
  • Planning — строит многошаговый план кастомизации.
  • Fine-tuning Setup — выбирает базовую модель из SageMaker AI Hub и технику (SFT/DPO/RLVR), настраивает гиперпараметры.
  • Dataset Evaluation — проверяет формат и схему датасета до запуска обучения.
  • Dataset Transformation — конвертирует данные между форматами (OpenAI chat, SageMaker AI, Hugging Face, Amazon Nova).
  • Fine-tuning — генерирует training‑ноутбуки для serverless‑finetuning в SageMaker AI.
  • Model Evaluation — настраивает LLM-as-a-Judge оценку (встроенные и кастомные метрики).
  • Model Deployment — выбирает путь деплоя (SageMaker AI endpoint или Bedrock) и генерирует код.

Skills лежат в виде markdown‑файлов в ~/.kiro/skills. Их можно редактировать, версионировать в Git и шарить внутри команды.

Поддерживаемые техники дообучения

Skills сейчас умеют три подхода и сами рекомендуют нужный на этапе планирования:

  • SFT (Supervised Fine-Tuning)
    • Обучение на парах «вход → правильный ответ».
    • Подходит для задач:
      • следование инструкциям;
      • жёсткий формат ответа;
      • адаптация к домену (медицина, юриспруденция, финансы).
  • DPO (Direct Preference Optimization)
    • Обучение на парах «предпочитаемый ответ» vs «отклонённый ответ».
    • Подходит для:
      • настройки стиля и тона;
      • согласования с человеческими предпочтениями;
      • задач, где есть субъективность.
  • RLVR (Reinforcement Learning with Verifiable Rewards)
    • Обучение по вознаграждению, которое вычисляется кодом.
    • Полезно там, где можно программно проверить корректность:
      • кодогенерация;
      • задачи с чёткими правилами и автоматической проверкой.

Интеграция с JupyterLab и ACP

В SageMaker AI Studio JupyterLab:

  • В правой панели есть чат, где по умолчанию активен Kiro.
  • Пространство (Space) автоматически подгружает SageMaker AI Skills в контекст агента.
  • Можно переключиться на другие ACP‑агенты (например, Claude Code) — они получат тот же доступ к Skills и AWS‑ресурсам через MCP‑серверы.

Агенты через Skills могут:

  • вызывать SageMaker AI API;
  • читать данные из Amazon S3;
  • работать с реестром моделей;
  • генерировать и запускать ноутбуки, которые вписываются в существующие ML‑пайплайны.

Что это значит для вас

Когда это реально полезно

1. Команды, которые хотят быстро запустить доменные LLM‑решения

Например:

  • медицинский ассистент, который объясняет клинические кейсы по шагам (как в примере с Qwen3‑0.6B и датасетом FreedomIntelligence/medical-o1-reasoning-SFT);
  • юр‑бот, который знает локальное законодательство и форматирует ответы под ваши шаблоны;
  • внутренний аналитический ассистент, который говорит на языке вашей отрасли.

Вместо того чтобы вручную собирать пайплайн «подготовка данных → обучение → оценка → деплой», вы описываете задачу в чате. Агент строит план, подбирает технику и генерирует рабочий код.

2. Разработчики, которые уже живут в JupyterLab

Если вы и так:

  • запускаете эксперименты в SageMaker;
  • пишете ноутбуки;
  • храните артефакты в S3 и MLflow,

то новая связка «Kiro + Skills» превращает JupyterLab в полноценную среду для полного цикла кастомизации без ручной рутины по boilerplate‑коду.

3. Команды с жёсткими требованиями к процессам и комплаенсу

Skills — это текстовые файлы. Вы можете:

  • зашить в них свои стандарты по подготовке данных, валидации и оценке;
  • потребовать обязательные шаги (например, проверка на утечки PII);
  • версионировать Skills в Git и накатывать их на все команды.

В итоге ассистенты перестают быть «магией», а превращаются в управляемый слой над вашим ML‑процессом.

Где это не поможет

  • Если у вас нет доступа к AWS или ваша инфраструктура жёстко завязана на других облаках без возможности подключить SageMaker — это решение вам не подойдёт.
  • Если вы не хотите работать через Jupyter/IDE и предпочитаете только UI‑консоль без кода — выгода будет меньше, потому что основная сила здесь в автогенерации и правке ноутбуков.
  • Если вы хотите максимально дешёвый one‑click чат‑бот, без контроля над данными, метриками и пайплайном — проще взять готовый SaaS‑конструктор.

Доступность из России

SageMaker AI Studio, Amazon Bedrock и интеграции с Anthropic и Google официально относятся к сервисам AWS. Для работы:

  • нужен аккаунт AWS с доступом к соответствующим регионам;
  • часто требуется платёжная карта, которую принимает AWS;
  • в ряде случаев для доступа к сопутствующим сервисам может понадобиться VPN.

Если ваша компания юридически и технически не может работать с AWS, вы не сможете использовать этот стек напрямую.

Место на рынке

Amazon здесь решает задачу не новой модели, а управляемого пайплайна кастомизации.

Что есть у конкурентов:

  • OpenAI предлагает fine-tuning через API для GPT‑3.5 и GPT‑4‑класса моделей, но:
    • пайплайн «подготовка данных → обучение → оценка → деплой» вы собираете сами;
    • нет стандартного набора Skills, который бы зашивал лучшие практики под ваш стек.
  • Anthropic даёт Claude Fine-Tuning и Claude Code, но фокус — на самой модели и IDE, а не на глубокой интеграции с облачной MLOps‑платформой уровня SageMaker.
  • Hugging Face и open source‑стек дают большую свободу, но всё придётся клеить руками: от конвертации форматов до MLflow и деплоя в прод.

SageMaker AI делает ставку на другое:

  • глубокая интеграция с AWS‑инфраструктурой (S3, MLflow Apps, Bedrock, SageMaker endpoints);
  • единый формат Skills, который можно таскать между агентами (Kiro, Claude Code, Cursor и т.д.);
  • поддержка сразу нескольких семейств моделей: Amazon Nova, GPT‑OSS, Llama, Qwen, DeepSeek.

Цифровых сравнений по скорости, стоимости токена или качеству дообученных моделей относительно GPT‑4o, Claude 3.5 или других игроков в материале нет. Основной акцент — на том, как быстро команда может пройти путь от идеи до прод‑модели, если уже живёт в AWS.

Установка

Запуск SageMaker AI Space с JupyterLab

  1. Зайдите в SageMaker AI Studio.
  2. В левом меню откройте Spaces или нажмите «Customize with agent» из Model Hub.
  3. Далее:
    • либо создайте новый Space и выберите JupyterLab как приложение;
    • либо откройте существующий Space, где уже есть JupyterLab.

Kiro в таких пространствах преднастроен по умолчанию.

Как запустить Kiro в JupyterLab

  1. Откройте правую боковую панель и нажмите на иконку чата.
  2. В поле ввода наберите @, чтобы увидеть список доступных агентов.
  3. Выберите @Kiro из выпадающего списка.
  4. Начните диалог, например: I want to customize a model.

Kiro требует аутентификацию при первом запуске в Space. Процесс:

  1. В JupyterLab откройте новый терминал: File → New → Terminal.
  2. Выполните команду:
kiro-cli login --use-device-flow
  1. В терминале появятся три варианта логина:
    • Use for Free with Builder ID
    • Use for Free with Google or GitHub
    • Use with Pro license

Выберите подходящий вариант и завершите аутентификацию.

После этого можно работать с Kiro в чате.

Как подключить Claude Code в JupyterLab

SageMaker AI Studio поддерживает дополнительные coding‑агенты по Agent Control Protocol (ACP). Среди них:

  • Claude (через claude-agent-acp);
  • OpenCode (через opencode CLI ≥ 1.0.0);
  • Gemini (через gemini CLI ≥ 0.34.0);
  • Codex (через codex-acp).

Установка Claude Code

  1. В терминале JupyterLab выполните:
npm install -g @zed-industries/claude-agent-acp
  1. Перезапустите Space:
    • либо командой в терминале:
restart-jupyter-server
  • либо через UI SageMaker Studio (restart Space).

Учтите: перезапуск удалит несохранённые изменения и состояние активных ядер.

  1. Пройдите аутентификацию Claude Code по его инструкции.
  2. В чате JupyterLab выберите агента @Claude в выпадающем списке персон.

Настройка Claude Code через Amazon Bedrock

Claude Code можно использовать через Amazon Bedrock в SageMaker AI Studio. Для этого:

  1. Включите доступ к нужным Bedrock‑моделям и выдайте execution‑роли права:
    • bedrock:InvokeModel
    • bedrock:InvokeModelWithResponseStream
  2. Создайте файл настроек для Claude Code:

~/.claude/settings.json:

{
  "env": {
    "CLAUDE_CODE_USE_BEDROCK": "1"
  }
}

После этого Claude Code будет использовать Bedrock как бэкенд для вызова моделей Claude.

Как запустить кастомизацию модели

1. Планирование через агента

В чате JupyterLab (Kiro или Claude Code) введите, например:

I want to fine-tune a model for clinical reasoning that walks through medical cases step-by-step before providing a diagnosis.

Дальше агент:

  • переходит в planning phase;
  • активирует Skills Planning и Fine-tuning Setup;
  • задаёт уточняющие вопросы:
    • где ваш датасет;
    • готов ли он к обучению;
    • какие метрики важны (accuracy, reward score и т.п.).

После подтверждения плана агент:

  • выбирает базовую модель (в примере — Qwen3‑0.6B);
  • рекомендует технику (для medical‑reasoning датасета — SFT);
  • подбирает гиперпараметры.

2. Обучение (Fine-tune in SageMaker AI)

Агент генерирует training‑ноутбук, который:

  • запускает serverless‑training job в SageMaker AI;
  • трекает метрики обучения и валидации через SageMaker AI MLflow Apps.

Что делать вам:

  1. Открыть сгенерированный ноутбук в JupyterLab.
  2. Проверить код, при необходимости внести правки.
  3. Запустить ячейки и отправить training‑job.
  4. Следить за процессом через интерфейс SageMaker AI Studio.

По мере обучения вы увидите, как loss падает, а модель учится вести пошаговое клиническое рассуждение перед диагнозом. Для детального анализа можно открыть MLflow и посмотреть метрики по шагам.

3. Оценка модели (Evaluation)

После обучения агент предлагает стратегию оценки. Варианты:

  • сравнить точность на отложенном наборе medical‑reasoning вопросов;
  • измерить улучшение reward‑score относительно базовой модели.

Агент генерирует evaluation‑ноутбук, который:

  • прогоняет fine‑tuned модель по evaluation‑датасету;
  • рассчитывает выбранные метрики (включая LLM-as-a-Judge);
  • отправляет результаты в MLflow для сравнения с базовой моделью.

Вы запускаете ноутбук, получаете отчёт и решаете, достаточно ли качества для продакшена.

4. Деплой (Deployment)

Когда вы довольны качеством, агент помогает развернуть модель.

Варианты:

  • SageMaker AI endpoint — для низкой латентности и tight‑интеграции с AWS‑сервисами.
  • Amazon Bedrock через Custom Model Import — если вы хотите использовать модель как часть Bedrock‑экосистемы.

Агент генерирует ещё один ноутбук, который:

  • создаёт endpoint или настраивает импорт в Bedrock;
  • отправляет тестовый запрос к развернутой модели;
  • показывает пример кода для интеграции.

Вы запускаете ноутбук, проверяете inference и дальше подключаете endpoint к своим приложениям.

Кастомизация Skills

Стандартный набор Skills покрывает типовые сценарии дообучения, но вы можете:

  • расширить существующие Skills, например Model Evaluation, добавив:
    • доменные метрики (BLEU/ROUGE для NLG, специфические медицинские или юридические показатели);
    • дополнительные проверки безопасности.
  • написать новые Skills для своих целей:
    • деплой в собственный on‑prem inference‑кластер;
    • интеграция с внутренними системами логирования;
    • кастомная подготовка данных.

Skills описываются в markdown‑файлах в директории:

~/.kiro/skills

Их удобно:

  • хранить в Git;
  • ревьюить через pull‑request‑ы;
  • раскатывать на все команды, чтобы у всех был единый «слой знаний» по ML‑процессам.

Итог

SageMaker AI с агентами и Skills превращает кастомизацию LLM‑моделей в управляемый процесс:

  • вы описываете задачу на естественном языке;
  • агент строит план, выбирает модель и технику дообучения;
  • генерирует ноутбуки для обучения, оценки и деплоя;
  • вы правите код и интегрируете его в свои пайплайны.

То, что раньше требовало месяцев работы ML‑команды с глубоким знанием SageMaker и тонкостей финетюнинга, теперь можно пройти за дни. Экспертиза упакована в Skills, процесс прозрачен, а код остаётся под вашим контролем.

Начать можно с GitHub‑репозитория плагина SageMaker AI agent skills и пошагового гида, подключить JupyterLab Space с Kiro и описать свой первый кейс в одном сообщении.


Читайте также