Дата публикации
ai_products

Anthropic покупает Vercept, чтобы научить Claude работать с софтом как человек

Что появилось / что изменилось

Anthropic купила стартап Vercept. Его команда целыми годами занималась тем, как научить ИИ «видеть» интерфейсы и кликать по ним, как живой пользователь.

Главный контекст — свежий релиз Claude Sonnet 4.6. Anthropic подчёркивает именно навыки работы с компьютером:

  • Sonnet 4.6 научили лучше работать в живых приложениях: браузер, таблицы, формы, сложные интерфейсы.
  • На бенчмарке OSWorld, который используют для оценки ИИ-ассистентов на компьютере, Sonnet-модели выросли с менее 15% в конце 2024 года до 72,5% сейчас.
  • По словам Anthropic, Sonnet 4.6 уже близок к уровню человека в задачах вроде:
    • навигация по сложным электронным таблицам;
    • заполнение веб-форм, в том числе при переключении между вкладками браузера.

Vercept в ближайшие недели отключит свой внешний продукт. Команда полностью переезжает в Anthropic и будет развивать направление computer use внутри Claude.

Как это работает

Anthropic двигается в сторону ассистента, который не только пишет код или отвечает в чате, но и сам работает в приложениях.

Сценарий такой:

  1. Пользователь даёт задачу на естественном языке: например, «собери данные из этих вкладок и сведи в таблицу».
  2. Claude получает доступ к «живому» окружению — браузеру или другим приложениям.
  3. ИИ видит интерфейс примерно как человек: окна, кнопки, поля ввода, таблицы.
  4. Дальше он пошагово кликает, скроллит, вводит текст, переключает вкладки, проверяет результат и продолжает.

Vercept как раз занимался двумя сложными частями:

  • Компьютерное зрение для интерфейсов. Распознавание кнопок, форм, таблиц, ошибок, всплывающих окон.
  • Логика действий. Какой элемент нажать, в каком порядке выполнять шаги, как восстанавливаться после ошибки.

Эта экспертиза ложится прямо в текущую работу Anthropic: сделать из Claude ассистента, который умеет не только писать инструкции, но и сам выполнять многошаговые действия в реальных программах.

Что это значит для вас

Если вы уже пользуетесь Claude для работы, сценарии становятся интереснее:

  • Разработка и код-ревью. Claude может не только читать репозиторий, но и работать с IDE-подобной средой: запускать тесты, править файлы, проверять результат.
  • Исследования и аналитика. ИИ способен сам открыть десятки вкладок, собрать данные, свести их в одну таблицу, привести к единому формату.
  • Рутина в браузере. Заполнение однотипных форм, работа с CRM, выгрузка отчётов, перемещение данных между сервисами.

Где это особенно полезно:

  • сложные, многошаговые задачи, где раньше приходилось вручную кликать по интерфейсу;
  • ситуации, когда API нет или оно ограничено, а браузерный интерфейс — единственный вариант.

Где не стоит рассчитывать на чудо:

  • критически важные операции с деньгами и юридическими документами без человеческой проверки;
  • интерфейсы, которые часто меняются или ведут себя нестабильно;
  • задачи, где ошибка в один клик может стоить слишком дорого.

Ещё один важный момент: доступ к Claude и его функциям computer use в России официально ограничен. Для работы скорее всего понадобится VPN и аккаунт в поддерживаемом регионе. Anthropic об этом прямо не пишет, но по факту сервис ориентирован на рынки, где компания официально работает.

Если вы инженер или продакт и думаете о карьере, Anthropic отдельно зовёт людей в инженерную команду — на сайте компании есть раздел с вакансиями.

Место на рынке

Anthropic напрямую не сравнивает Claude Sonnet 4.6 с конкурентами вроде GPT-4o или других ассистентов, которые тоже умеют управлять браузером и приложениями. Компания даёт только один числовой ориентир — 72,5% на OSWorld против менее 15% в конце 2024 года у собственных же Sonnet-моделей.

OSWorld — один из стандартных бенчмарков для «компьютерных» ассистентов. Но без открытых цифр по GPT-4o, Gemini и другим системам честное сравнение по скорости, качеству и цене пока невозможно.

Из фактов, которые можно зафиксировать:

  • Anthropic последовательно собирает команды под computer use: до Vercept компания уже купила Bun.
  • Фокус — не только на качестве ответов в чате, но и на реальной работе в софте: от браузера до сложных интерфейсов.

Для бизнеса и продвинутых пользователей это сигнал: Anthropic всерьёз инвестирует в ассистента, который умеет не только «думать», но и «кликать». Но выбор между Claude, GPT-4o и другими ассистентами по-прежнему придётся делать на своём стенде и своих задачах — общедоступных честных сравнений пока нет.

Anthropic покупает Vercept, чтобы научить Claude работать с софтом как человек — VogueTech | VogueTech