Дата публикации
coding

ProofShot: как дать ИИ-агентам «глаза» и доказательства того, что код реально работает

Что появилось / что изменилось

ProofShot — это open source‑утилита (MIT‑лицензия), которая добавляет к любому ИИ‑кодеру визуальную проверку результата. Идея простая: агент говорит «готово», а ProofShot собирает доказательства, что интерфейс действительно работает.

Что умеет сейчас:

  • Обёртка вокруг dev‑сервера: запускает ваш npm run dev, поднимает headless Chromium и автоматически включает запись сессии.
  • Полная запись браузера: видео всей сессии с автоматической обрезкой «мёртвого времени», когда агент просто ждёт.
  • Лог действий: навигация, клики, ввод в формы, скролл, снимки экрана. В примере с доской задач ProofShot фиксирует 9 шагов — от перехода на http://localhost:3000/board до скролла и финального скриншота с новой задачей.
  • Сбор ошибок: перехватывает ошибки в консоли браузера и сканирует логи сервера по шаблонам для JavaScript, Python, Go, Rust и других языков.
  • HTML‑просмотрщик: один автономный HTML‑файл с видео, таймлайном действий, скриншотами и подписями элементов.
  • PR‑артефакты: генерирует SUMMARY.md и форматированный вывод, который можно сразу вклеить в pull request, плюс визуальное сравнение с базовыми скриншотами.
  • Агент‑агностичный подход: один раз ставите CLI (npm install -g proofshot), и им могут пользоваться Claude, Code Cursor, Codex, Gemini, Windsurf и любые MCP‑совместимые агенты через CLI.

Как это работает

ProofShot строится вокруг трёх команд CLI.

  1. Старт

    • Команда: proofshot start --run "npm run dev".
    • Запускает ваш dev‑сервер.
    • Поднимает headless Chromium.
    • Начинает запись видео сессии.
  2. Тест

    • Ваш ИИ‑агент управляет браузером через CLI:
      • proofshot exec navigate "http://localhost:3000" — переход по URL.
      • proofshot exec screenshot "homepage" — снимок экрана с подписью.
    • Аналогично отправляются команды на клик, ввод текста, скролл.
    • Каждое действие попадает в структурированный таймлайн: время, тип действия, целевой элемент, значение.
  3. Стоп

    • Команда: proofshot stop.
    • Останавливает запись видео.
    • Собирает ошибки из консоли браузера и логов сервера.
    • Обрезает периоды бездействия.
    • Генерирует «пакет доказательств»: видео, скриншоты, лог действий, HTML‑просмотрщик, SUMMARY.md и данные для визуального диффа.

Все артефакты лежат локально. Никакого отдельного веб‑сервиса не требуется: вы открываете один HTML‑файл и видите синхронизированные видео, скриншоты и таймлайн.

Что это значит для вас

Для кого это полезно:

  • Команды, которые уже используют ИИ‑агентов для разработки. Если вы гоняете Claude, Gemini или Codex по репозиторию, ProofShot даёт простой способ потребовать от агента не только тесты, но и визуальное подтверждение, что UI действительно работает.
  • Фронтенд‑разработчики и лиды. Вместо долгих описаний «что именно сделал агент», вы получаете видео и пошаговый лог. Это удобно для ревью и для обучения агентов: видно, где они «путаются» в интерфейсе.
  • QA и продукт‑менеджеры. Можно прикреплять HTML‑просмотрщик и SUMMARY.md к тикетам и PR. Один файл — и видно весь сценарий: какие элементы кликали, какие формы заполняли, какие ошибки вылезли.

Где особенно уместно:

  • Автоматизация регресса UI, когда ИИ‑агент вносит правки в верстку или логику.
  • Проверка сложных пользовательских сценариев: много шагов, несколько форм, фильтры, скролл.
  • Документация поведения интерфейса для удалённых команд: не нужно объяснять словами, достаточно открыть HTML‑отчёт.

Где ожидания стоит понизить:

  • ProofShot сам по себе не тестирует бизнес‑логику и не пишет юнит‑тесты. Он фиксирует то, что делает агент в браузере.
  • Если у вас чисто backend‑сервис без UI, ценность будет ниже: основное преимущество — визуальный контроль фронтенда.

Про доступность: это обычный CLI‑инструмент с GitHub и npm. Никаких ограничений по региону и необходимости VPN из описания не следует. Если npm и GitHub у вас открываются, ProofShot тоже заработает.

Место на рынке

ProofShot логично сравнивать не с LLM, а с инструментами вокруг ИИ‑кодеров и e2e‑тестов.

По сути, он решает задачу, которую сейчас закрывают смесью Playwright/Cypress, скриншотов из CI и ручных записей экрана. Отличие в том, что ProofShot заточен под ИИ‑агентов и их CLI‑интерфейсы:

  • Он не пытается заменить Playwright или Cypress, а добавляет слой «доказательств» поверх уже написанного кода.
  • Любой агент, который умеет дергать CLI, автоматически получает визуальную верификацию без отдельной интеграции SDK.

Прямых числовых сравнений с другими инструментами авторы не приводят: нет данных по скорости, стоимости или объёму сохраняемых артефактов относительно альтернатив. Зато есть чёткий сценарий использования: «агент закоммитил код — ProofShot собрал видео, логи и SUMMARY.md, которые можно положить в PR».

Если вы уже строите пайплайн вокруг ИИ‑кодеров, ProofShot выглядит как недостающий слой прозрачности: он не ускоряет саму генерацию кода, но делает результат понятнее и проверяемее для людей, которые принимают решение мёрджить изменения или откатывать их.


Читайте также

🔗 Источник: https://proofshot.argil.io/
ProofShot: как дать ИИ-агентам «глаза» и доказательства того, что код реально работает — VogueTech | VogueTech