ProofShot: как дать ИИ-агентам «глаза» и доказательства того, что код реально работает — VogueTech

Что появилось / что изменилось

ProofShot — это open source‑утилита (MIT‑лицензия), которая добавляет к любому ИИ‑кодеру визуальную проверку результата. Идея простая: агент говорит «готово», а ProofShot собирает доказательства, что интерфейс действительно работает.

Что умеет сейчас:

Обёртка вокруг dev‑сервера: запускает ваш npm run dev, поднимает headless Chromium и автоматически включает запись сессии.
Полная запись браузера: видео всей сессии с автоматической обрезкой «мёртвого времени», когда агент просто ждёт.
Лог действий: навигация, клики, ввод в формы, скролл, снимки экрана. В примере с доской задач ProofShot фиксирует 9 шагов — от перехода на http://localhost:3000/board до скролла и финального скриншота с новой задачей.
Сбор ошибок: перехватывает ошибки в консоли браузера и сканирует логи сервера по шаблонам для JavaScript, Python, Go, Rust и других языков.
HTML‑просмотрщик: один автономный HTML‑файл с видео, таймлайном действий, скриншотами и подписями элементов.
PR‑артефакты: генерирует SUMMARY.md и форматированный вывод, который можно сразу вклеить в pull request, плюс визуальное сравнение с базовыми скриншотами.
Агент‑агностичный подход: один раз ставите CLI (npm install -g proofshot), и им могут пользоваться Claude, Code Cursor, Codex, Gemini, Windsurf и любые MCP‑совместимые агенты через CLI.

Как это работает

ProofShot строится вокруг трёх команд CLI.

Старт
- Команда: proofshot start --run "npm run dev".
- Запускает ваш dev‑сервер.
- Поднимает headless Chromium.
- Начинает запись видео сессии.
Тест
- Ваш ИИ‑агент управляет браузером через CLI:
  - proofshot exec navigate "http://localhost:3000" — переход по URL.
  - proofshot exec screenshot "homepage" — снимок экрана с подписью.
- Аналогично отправляются команды на клик, ввод текста, скролл.
- Каждое действие попадает в структурированный таймлайн: время, тип действия, целевой элемент, значение.
Стоп
- Команда: proofshot stop.
- Останавливает запись видео.
- Собирает ошибки из консоли браузера и логов сервера.
- Обрезает периоды бездействия.
- Генерирует «пакет доказательств»: видео, скриншоты, лог действий, HTML‑просмотрщик, SUMMARY.md и данные для визуального диффа.

Все артефакты лежат локально. Никакого отдельного веб‑сервиса не требуется: вы открываете один HTML‑файл и видите синхронизированные видео, скриншоты и таймлайн.

Что это значит для вас

Для кого это полезно:

Команды, которые уже используют ИИ‑агентов для разработки. Если вы гоняете Claude, Gemini или Codex по репозиторию, ProofShot даёт простой способ потребовать от агента не только тесты, но и визуальное подтверждение, что UI действительно работает.
Фронтенд‑разработчики и лиды. Вместо долгих описаний «что именно сделал агент», вы получаете видео и пошаговый лог. Это удобно для ревью и для обучения агентов: видно, где они «путаются» в интерфейсе.
QA и продукт‑менеджеры. Можно прикреплять HTML‑просмотрщик и SUMMARY.md к тикетам и PR. Один файл — и видно весь сценарий: какие элементы кликали, какие формы заполняли, какие ошибки вылезли.

Где особенно уместно:

Автоматизация регресса UI, когда ИИ‑агент вносит правки в верстку или логику.
Проверка сложных пользовательских сценариев: много шагов, несколько форм, фильтры, скролл.
Документация поведения интерфейса для удалённых команд: не нужно объяснять словами, достаточно открыть HTML‑отчёт.

Где ожидания стоит понизить:

ProofShot сам по себе не тестирует бизнес‑логику и не пишет юнит‑тесты. Он фиксирует то, что делает агент в браузере.
Если у вас чисто backend‑сервис без UI, ценность будет ниже: основное преимущество — визуальный контроль фронтенда.

Про доступность: это обычный CLI‑инструмент с GitHub и npm. Никаких ограничений по региону и необходимости VPN из описания не следует. Если npm и GitHub у вас открываются, ProofShot тоже заработает.

Место на рынке

ProofShot логично сравнивать не с LLM, а с инструментами вокруг ИИ‑кодеров и e2e‑тестов.

По сути, он решает задачу, которую сейчас закрывают смесью Playwright/Cypress, скриншотов из CI и ручных записей экрана. Отличие в том, что ProofShot заточен под ИИ‑агентов и их CLI‑интерфейсы:

Он не пытается заменить Playwright или Cypress, а добавляет слой «доказательств» поверх уже написанного кода.
Любой агент, который умеет дергать CLI, автоматически получает визуальную верификацию без отдельной интеграции SDK.

Прямых числовых сравнений с другими инструментами авторы не приводят: нет данных по скорости, стоимости или объёму сохраняемых артефактов относительно альтернатив. Зато есть чёткий сценарий использования: «агент закоммитил код — ProofShot собрал видео, логи и SUMMARY.md, которые можно положить в PR».

Если вы уже строите пайплайн вокруг ИИ‑кодеров, ProofShot выглядит как недостающий слой прозрачности: он не ускоряет саму генерацию кода, но делает результат понятнее и проверяемее для людей, которые принимают решение мёрджить изменения или откатывать их.

Что появилось / что изменилось

Как это работает

Что это значит для вас

Место на рынке

Читайте также