- Дата публикации
Один markdown-файл превращает вашего AI-ассистента в автономного исследователя кода
Что появилось / что изменилось
Появился researcher.md — один markdown-файл, который добавляет Claude Code, Cursor или любому другому AI-агенту роль автономного исследователя кода.
После подключения файла ассистент сам:
- проектирует эксперименты;
- формулирует гипотезы и проверяет их;
- отбрасывает неудачные варианты и фиксирует удачные;
- ведёт журнал экспериментов и коммитит код перед каждым запуском.
Авторы заявляют, что агент способен прогонять больше 30 экспериментов за ночь без участия разработчика. В примере оптимизации производительности он:
- уменьшил p99 задержку API с 142 мс (базовый уровень) до 89 мс;
- зафиксировал промежуточный «лучший результат» 118 мс при батчинге запросов к базе данных;
- перебрал несколько подходов: кэширование, connection pooling, LRU-кэш, KD-дерево для поиска соседей.
Вся история экспериментов сохраняется в отдельной директории .lab/, которая не попадает в git, но переживает любые операции с репозиторием.
Лицензия — MIT.
Как это работает
researcher.md — это сценарий поведения для AI-агента, описанный в markdown. Файл задаёт протокол исследования:
- агент начинает с интервью: что именно оптимизировать, по каким метрикам и до каких значений;
- создаёт отдельную ветку в git (например, research/reduce-latency) и работает только в ней;
- перед каждым экспериментом формулирует гипотезу и список изменений в коде;
- делает коммит, запускает тест или бенчмарк, фиксирует результат;
- при ухудшении метрик откатывает изменения, помечает эксперимент как «discard»;
- при улучшении — сохраняет результат как «keep» и двигается дальше.
Агент умеет ветвить исследование: форкает ветки, если нужно параллельно попробовать разные подходы. Он отслеживает, когда застрял в локальном минимуме, и может переключаться на другие идеи.
Формат журнала экспериментов включает:
- номер эксперимента и родительский;
- ветку и тип эксперимента;
- гипотезу;
- конкретные изменения в файлах (например, замена O(n²) поиска соседей на scipy.spatial.KDTree);
- итоговые метрики (например, p99 = 89 мс против 142 мс на старте);
- статус: keep/discard;
- краткий инсайт — что на самом деле оказалось узким местом.
Все артефакты работы агент складывает в .lab/: там живут логи, дерево экспериментов и метаданные. Git управляет кодом, .lab/ — знанием о том, что уже пробовали.
Что это значит для вас
researcher.md пригодится, если вы уже используете Claude Code, Cursor или другой AI-редактор, который читает markdown-инструкции, и хотите не просто «автодополнение», а систематические эксперименты.
Где полезно:
- Оптимизация API: снижение p50/p99, рост throughput, проверка разных стратегий кэширования, connection pooling, батчинга запросов.
- Ускорение тестов: сокращение времени прогона, подбор параллелизации, поиск узких мест в тестовой инфраструктуре.
- Сборка фронтенда: уменьшение bundle size через tree-shaking, code splitting, замену зависимостей.
- Prompt engineering: сравнение точности, стоимости и токен-юзажа разных промптов.
- Алгоритмы: выбор реализаций с лучшей асимптотикой и меньшим потреблением памяти.
- Конфигурации: настройки БД, размеры кэшей, размеры пулов потоков.
Где ожидания стоит понизить:
- если у вас нет автоматизируемой метрики (например, чисто продуктовые решения без числовой оценки), прогресс будет медленнее;
- если проект плохо покрыт тестами и бенчмарками, агенту придётся сначала строить инфраструктуру измерений;
- если вы рассчитываете на «одну кнопку, которая всё оптимизирует», придётся участвовать хотя бы на старте: сформулировать цель, метрики и ограничения.
Инструмент работает поверх существующих AI-агентов. Если доступ к Claude Code или Cursor в вашей стране ограничен, понадобится VPN или локальное решение, которое умеет читать markdown-инструкции и управлять git.
Место на рынке
researcher.md не конкурирует напрямую с GPT-4o, Claude 3.5 или другими языковыми моделями. Он использует их как «двигатель», а сам выступает как надстройка-протокол для автономных экспериментов в кодовой базе.
По сути, это попытка обобщить автотюнинг не только для ML, но и для обычной инженерии: от latency API до размера бандла и конфигураций инфраструктуры. Вместо отдельного сервиса здесь один файл с правилами работы, который вы добавляете в уже используемый AI-редактор.
Рядом по идее находится другой проект автора — Yggdrasil. Он даёт репозиторию постоянную семантическую память: хранит архитектуру, ограничения и прошлые решения, чтобы каждый новый таск начинался с контекста, а не с гигантского промпта.
Если вы уже пробовали подключать AI к разработке и упирались в то, что ассистент «забывает» эксперименты и повторяет одни и те же ошибки, связка researcher.md + Yggdrasil может закрыть именно эту проблему: первый отвечает за методичное исследование, второй — за память о прошлом опыте.