- Дата публикации
8 уровней агентной разработки: как превратить ИИ из автодополнения в ночную смену программистов
Что появилось / что изменилось
Разработчики всё чаще упираются не в потолок возможностей ИИ, а в собственный процесс. SWE-bench‑рекорды растут, а реальные метрики продуктивности команд почти не двигаются. На одном полюсе — команда Anthropic, которая собрала продукт Cowork за 10 дней. На другом — команды, которые с теми же Claude‑моделями застревают на сломанном прототипе.
Автор материала предлагает смотреть на это как на «8 уровней агентной инженерии» — от простого таб‑комплита до полноценных фоновых агентов, которые сами поднимают PR‑ы, пока вы спите. Ключевое изменение — фокус сместился от «насколько умный ИИ» к «насколько команда умеет превращать его в работающий процесс».
По пути появляются несколько конкретных практик:
- переход от таб‑комплита к IDE вроде Cursor с глубокой интеграцией чата и кода;
- контекст‑инжиниринг: борьба за каждый токен в промпте и аккуратная подача контекста;
- работа с множеством инструментов (MCP, Playwright, обработка изображений) и учёт того, что они быстро съедают контекст;
- компаундинг‑инжиниринг — настройка процессов так, чтобы каждый запуск агента улучшал следующие сессии.
Как это работает
Базовый уровень — таб‑комплит в стиле GitHub Copilot. Опытный разработчик набрасывает скелет функции, ИИ дорисовывает очевидные куски. Польза есть, но модель видит только локальный контекст и один файл.
Следующий шаг — IDE вроде Cursor, где чат привязан ко всей кодовой базе. Модель получает доступ сразу к нескольким файлам, может предлагать многофайловые правки, но упирается в размер контекстного окна. Если в контекст попадает не тот файл или слишком много лишнего, качество ответов падает.
На этом месте включается контекст‑инжиниринг. Разработчик начинает экономить каждый токен:
- чистит системные промпты и rules‑файлы (.cursorrules, CLAUDE.md), убирая воду;
- аккуратно описывает инструменты: модель читает эти описания и на их основе решает, что вызывать;
- управляет историей диалога, чтобы агент через десять ходов не терял нить задачи;
- ограничивает список доступных инструментов на каждом шаге, чтобы модель не тратила токены на разбор десятков схем.
При этом часть инструментов вроде Playwright или обработки изображений через MCP прожигают контекст особенно быстро. Пара таких вызовов — и вы уже в «compact session» в Claude Code, где модель вынуждена сильнее ужимать историю.
Компаундинг‑инжиниринг добавляет ещё один слой: вы не просто настраиваете текущую сессию, а строите систему, где каждая итерация улучшает следующие. Конфиги, правила, примеры запросов, структура репозитория — всё это постепенно шлифуется и даёт накопительный эффект.
Что это значит для вас
Если вы уже используете Copilot‑подобный таб‑комплит, вы находитесь на самых первых уровнях. Это полезно, но почти не меняет архитектуру работы команды. Основной прирост начинается, когда вы:
- переходите в IDE с полноценным код‑чатом (Cursor, Claude Code);
- учитесь формулировать задачи в виде плана для агента и запускать его на многофайловые правки;
- начинаете осознанно управлять контекстом.
Где это особенно помогает:
- Поддержка и рефакторинг больших кодовых баз. Агент, который видит несколько модулей сразу и получает только нужные файлы, заметно ускоряет типовые задачи.
- Ночная автоматизация. Фоновые агенты могут поднимать черновые PR‑ы, пока команда спит, если вы заранее продумали контекст, правила и доступные инструменты.
- Работа с «тяжёлыми» инструментами. Если вы используете Playwright через MCP или активно гоняете скриншоты и макеты через ИИ, без жёсткой экономии токенов вы быстро упрётесь в лимиты контекста и задержки по времени до первого токена.
Где подход может не зайти:
- Маленькие пет‑проекты на пару файлов. Там проще дописать руками или ограничиться базовым автодополнением.
- Команды, где один человек живёт на уровне «агенты + PR‑ы во сне», а остальные смотрят на ИИ как на чат‑бота. Ваша пропускная способность упрётся в коллег, которые продолжают вручную ревьюить каждый PR и не доверяют агентам даже рутину.
Если вы тимлид, вам выгодно подтягивать всю команду по этим уровням. Иначе вы получите пару «магистров ИИ», которые всё равно стоят в очереди на ревью к «джунам без агентов».
Место на рынке
Автор описывает не новый продукт, а способ работы с уже существующими инструментами: Cursor, Claude Code, MCP‑интеграции, голосовые интерфейсы со встроенными меньшими моделями. Общий тренд — модели становятся терпимее к шумному контексту и получают большие контекстные окна, но чувствительность к размеру и качеству контекста никуда не делась.
Меньшие модели, которые часто используют в голосовых приложениях, сильнее зависят от аккуратного контекста. У них меньше окно и выше цена ошибки в токенах: чем длиннее промпт, тем выше задержка до первого токена и тем менее комфортен голосовой интерфейс.
Инструменты на базе MCP, особенно с Playwright и обработкой изображений, поднимают планку требований к контекст‑инжинирингу. Пара небрежных промптов — и вы тратите больше токенов на разбор схем инструментов и картинок, чем на реальную работу.
Главная мысль: сейчас ИИ‑кодинг уже упирается не в «сырость моделей», а в уровень агентной инженерии команды. Одни и те же Claude‑модели позволяют Anthropic собрать продукт за 10 дней и одновременно держат другие команды на стадии сломанного POC. Разница — в том, на каком из восьми уровней вы находитесь и насколько осознанно обращаетесь с контекстом и агентами.