- Дата публикации
ProofShot: как дать ИИ-агентам «глаза» и доказательства того, что код реально работает
Что появилось / что изменилось
ProofShot — это open source‑утилита (MIT‑лицензия), которая добавляет к любому ИИ‑кодеру визуальную проверку результата. Идея простая: агент говорит «готово», а ProofShot собирает доказательства, что интерфейс действительно работает.
Что умеет сейчас:
- Обёртка вокруг dev‑сервера: запускает ваш
npm run dev, поднимает headless Chromium и автоматически включает запись сессии. - Полная запись браузера: видео всей сессии с автоматической обрезкой «мёртвого времени», когда агент просто ждёт.
- Лог действий: навигация, клики, ввод в формы, скролл, снимки экрана. В примере с доской задач ProofShot фиксирует 9 шагов — от перехода на
http://localhost:3000/boardдо скролла и финального скриншота с новой задачей. - Сбор ошибок: перехватывает ошибки в консоли браузера и сканирует логи сервера по шаблонам для JavaScript, Python, Go, Rust и других языков.
- HTML‑просмотрщик: один автономный HTML‑файл с видео, таймлайном действий, скриншотами и подписями элементов.
- PR‑артефакты: генерирует
SUMMARY.mdи форматированный вывод, который можно сразу вклеить в pull request, плюс визуальное сравнение с базовыми скриншотами. - Агент‑агностичный подход: один раз ставите CLI (
npm install -g proofshot), и им могут пользоваться Claude, Code Cursor, Codex, Gemini, Windsurf и любые MCP‑совместимые агенты через CLI.
Как это работает
ProofShot строится вокруг трёх команд CLI.
-
Старт
- Команда:
proofshot start --run "npm run dev". - Запускает ваш dev‑сервер.
- Поднимает headless Chromium.
- Начинает запись видео сессии.
- Команда:
-
Тест
- Ваш ИИ‑агент управляет браузером через CLI:
proofshot exec navigate "http://localhost:3000"— переход по URL.proofshot exec screenshot "homepage"— снимок экрана с подписью.
- Аналогично отправляются команды на клик, ввод текста, скролл.
- Каждое действие попадает в структурированный таймлайн: время, тип действия, целевой элемент, значение.
- Ваш ИИ‑агент управляет браузером через CLI:
-
Стоп
- Команда:
proofshot stop. - Останавливает запись видео.
- Собирает ошибки из консоли браузера и логов сервера.
- Обрезает периоды бездействия.
- Генерирует «пакет доказательств»: видео, скриншоты, лог действий, HTML‑просмотрщик,
SUMMARY.mdи данные для визуального диффа.
- Команда:
Все артефакты лежат локально. Никакого отдельного веб‑сервиса не требуется: вы открываете один HTML‑файл и видите синхронизированные видео, скриншоты и таймлайн.
Что это значит для вас
Для кого это полезно:
- Команды, которые уже используют ИИ‑агентов для разработки. Если вы гоняете Claude, Gemini или Codex по репозиторию, ProofShot даёт простой способ потребовать от агента не только тесты, но и визуальное подтверждение, что UI действительно работает.
- Фронтенд‑разработчики и лиды. Вместо долгих описаний «что именно сделал агент», вы получаете видео и пошаговый лог. Это удобно для ревью и для обучения агентов: видно, где они «путаются» в интерфейсе.
- QA и продукт‑менеджеры. Можно прикреплять HTML‑просмотрщик и
SUMMARY.mdк тикетам и PR. Один файл — и видно весь сценарий: какие элементы кликали, какие формы заполняли, какие ошибки вылезли.
Где особенно уместно:
- Автоматизация регресса UI, когда ИИ‑агент вносит правки в верстку или логику.
- Проверка сложных пользовательских сценариев: много шагов, несколько форм, фильтры, скролл.
- Документация поведения интерфейса для удалённых команд: не нужно объяснять словами, достаточно открыть HTML‑отчёт.
Где ожидания стоит понизить:
- ProofShot сам по себе не тестирует бизнес‑логику и не пишет юнит‑тесты. Он фиксирует то, что делает агент в браузере.
- Если у вас чисто backend‑сервис без UI, ценность будет ниже: основное преимущество — визуальный контроль фронтенда.
Про доступность: это обычный CLI‑инструмент с GitHub и npm. Никаких ограничений по региону и необходимости VPN из описания не следует. Если npm и GitHub у вас открываются, ProofShot тоже заработает.
Место на рынке
ProofShot логично сравнивать не с LLM, а с инструментами вокруг ИИ‑кодеров и e2e‑тестов.
По сути, он решает задачу, которую сейчас закрывают смесью Playwright/Cypress, скриншотов из CI и ручных записей экрана. Отличие в том, что ProofShot заточен под ИИ‑агентов и их CLI‑интерфейсы:
- Он не пытается заменить Playwright или Cypress, а добавляет слой «доказательств» поверх уже написанного кода.
- Любой агент, который умеет дергать CLI, автоматически получает визуальную верификацию без отдельной интеграции SDK.
Прямых числовых сравнений с другими инструментами авторы не приводят: нет данных по скорости, стоимости или объёму сохраняемых артефактов относительно альтернатив. Зато есть чёткий сценарий использования: «агент закоммитил код — ProofShot собрал видео, логи и SUMMARY.md, которые можно положить в PR».
Если вы уже строите пайплайн вокруг ИИ‑кодеров, ProofShot выглядит как недостающий слой прозрачности: он не ускоряет саму генерацию кода, но делает результат понятнее и проверяемее для людей, которые принимают решение мёрджить изменения или откатывать их.