- Дата публикации
HyperAgents: ИИ-агенты, которые переписывают собственный код и учатся на ходу
Что появилось / что изменилось
HyperAgents — это фреймворк для запуска самоулучшающихся ИИ-агентов, которые могут оптимизироваться под любую вычислимую задачу. Ключевая идея: агент не только решает задачу, но и генерирует, тестирует и меняет собственный код.
Проект умеет:
- Работать с несколькими LLM одновременно: через ключи для OpenAI (например, GPT-4/4.1), Anthropic (Claude) и Google Gemini. Ключи задаются в
.env(OPENAI_API_KEY,ANTHROPIC_API_KEY,GEMINI_API_KEY). - Запускать «мета-агента», который анализирует исходный код, предлагает патчи и формирует diff-файлы изменений.
- Запускать «задачных» агентов для конкретных доменов: в репозитории есть папка
domains/с отдельным кодом под разные типы задач. - Сохранять все результаты и логи в директорию
outputs/, включая большие архивы экспериментов в виде многотомных ZIP (.z01,.z02и т.д.).
Разработчики предусмотрели как обычный запуск через Python (generate_loop.py), так и сборку Docker-контейнера (docker build --network=host -t hyperagents .), что упрощает развёртывание.
Как это работает
Архитектура строится вокруг двух типов агентов:
- Task Agent (
task_agent.py) — агент, который решает конкретную задачу в заданном домене. Например, пишет код, оптимизирует скрипт или анализирует данные. Он использует LLM через единый слой абстракции в папкеagent/. - Meta Agent (
meta_agent.py) — надстройка, которая читает результаты работы task-агентов, просматривает код репозитория, генерирует изменения и формирует diff. Для запуска есть вспомогательный скриптrun_meta_agent.py.
Запуск основного цикла выполняется через:
python generate_loop.py --domains <domain>
Под капотом:
- В
agent/лежит код для обращения к GPT, Claude и Gemini через их API. - В
domains/— отдельная логика под разные задачи, чтобы один и тот же фреймворк можно было применить к разным типам проектов. - В
analysis/— скрипты для построения графиков и последующего анализа экспериментов. - В
utils/— общие функции, которыми пользуются все части системы.
Экспериментальные логи сохраняются как многотомный ZIP. Для восстановления:
zip -s 0 outputs_os_parts.zip --out unsplit_logs.zip
unzip unsplit_outputs.zip
HyperAgents исполняет сгенерированный код локально, поэтому это не просто чат с ИИ, а полноценный цикл: LLM → код → выполнение → анализ → новые патчи.
Что это значит для вас
HyperAgents — это инструмент для тех, кто хочет поручить ИИ не только написание кода, но и эволюцию самого проекта.
Где это полезно:
- Исследователи ИИ и инженеры ML. Можно ставить мета-задачи: «улучшай этот репозиторий по таким метрикам» и смотреть, какие изменения предлагает агент.
- Разработчики инструментов и фреймворков. Подходит для экспериментов с автогенерацией патчей, рефакторингом, поиском багов и полуавтоматическим улучшением библиотек.
- Академические проекты. Удобная площадка для изучения самоулучшающихся систем: есть разделение на мета- и таск-агентов, логирование, разные домены.
Где лучше не использовать:
- В продакшене без жёстких sandbox-ограничений. Агент запускает сгенерированный код, а это всегда риск.
- В проектах с чувствительными данными или в инфраструктуре без изоляции.
Требуется базовое владение Linux и Python:
- Установка системных пакетов через
dnf(включаяgraphviz,cmake,ninja-build,bzip2-devel,zlib-devel,ncurses-devel,libffi-devel). - Создание виртуального окружения на Python 3.12 и установка зависимостей:
python3.12 -m venv venv_nat
source venv_nat/bin/activate
pip install -r requirements.txt
pip install -r requirements_dev.txt
Проект использует API OpenAI, Anthropic и Google, поэтому в России доступ может зависеть от вашего провайдера и может потребовать VPN.
Безопасность — слабое место. Авторы честно предупреждают: код, который пишет модель, потенциально опасен. Он вряд ли будет откровенно вредоносным при текущих настройках, но может вести себя разрушительно из-за ошибок или неверных предположений модели. Используя HyperAgents, вы осознанно принимаете этот риск.
Если вам нужен «просто ассистент для кода», HyperAgents избыточен. Это скорее лаборатория для экспериментов с самоизменяющимися ИИ-агентами.
Место на рынке
HyperAgents — нишевый исследовательский фреймворк, а не конкурент чат-ботам вроде GPT-4o или Claude. Здесь нет веб-интерфейса «из коробки», ключевой сценарий — запуск через консоль и работу с исходным кодом проекта.
Сравнивать его с обычными IDE-плагинами вроде GitHub Copilot тоже некорректно: Copilot предлагает подсказки, а HyperAgents строит полноценный цикл самоулучшения, где мета-агент сам ищет, что переписать и как.
В экосистеме open-source он ближе к экспериментальным автономным агентам и исследовательским платформам для self-improvement. Проект ориентирован на тех, кто хочет руками трогать автогенерацию патчей, запускать LLM из разных поставщиков и анализировать, как меняется кодовая база под управлением ИИ.
Цифр по скорости, стоимости токена или качеству относительно других систем разработчики не приводят. Про HyperAgents корректнее говорить как о песочнице для экспериментов с самоулучшающимися агентами поверх GPT, Claude и Gemini, а не как о готовом продукте для массового использования.