Anthropic покупает Vercept, чтобы научить Claude работать с софтом как человек — VogueTech

Что появилось / что изменилось

Anthropic купила стартап Vercept. Его команда целыми годами занималась тем, как научить ИИ «видеть» интерфейсы и кликать по ним, как живой пользователь.

Главный контекст — свежий релиз Claude Sonnet 4.6. Anthropic подчёркивает именно навыки работы с компьютером:

Sonnet 4.6 научили лучше работать в живых приложениях: браузер, таблицы, формы, сложные интерфейсы.
На бенчмарке OSWorld, который используют для оценки ИИ-ассистентов на компьютере, Sonnet-модели выросли с менее 15% в конце 2024 года до 72,5% сейчас.
По словам Anthropic, Sonnet 4.6 уже близок к уровню человека в задачах вроде:
- навигация по сложным электронным таблицам;
- заполнение веб-форм, в том числе при переключении между вкладками браузера.

Vercept в ближайшие недели отключит свой внешний продукт. Команда полностью переезжает в Anthropic и будет развивать направление computer use внутри Claude.

Как это работает

Anthropic двигается в сторону ассистента, который не только пишет код или отвечает в чате, но и сам работает в приложениях.

Сценарий такой:

Пользователь даёт задачу на естественном языке: например, «собери данные из этих вкладок и сведи в таблицу».
Claude получает доступ к «живому» окружению — браузеру или другим приложениям.
ИИ видит интерфейс примерно как человек: окна, кнопки, поля ввода, таблицы.
Дальше он пошагово кликает, скроллит, вводит текст, переключает вкладки, проверяет результат и продолжает.

Vercept как раз занимался двумя сложными частями:

Компьютерное зрение для интерфейсов. Распознавание кнопок, форм, таблиц, ошибок, всплывающих окон.
Логика действий. Какой элемент нажать, в каком порядке выполнять шаги, как восстанавливаться после ошибки.

Эта экспертиза ложится прямо в текущую работу Anthropic: сделать из Claude ассистента, который умеет не только писать инструкции, но и сам выполнять многошаговые действия в реальных программах.

Что это значит для вас

Если вы уже пользуетесь Claude для работы, сценарии становятся интереснее:

Разработка и код-ревью. Claude может не только читать репозиторий, но и работать с IDE-подобной средой: запускать тесты, править файлы, проверять результат.
Исследования и аналитика. ИИ способен сам открыть десятки вкладок, собрать данные, свести их в одну таблицу, привести к единому формату.
Рутина в браузере. Заполнение однотипных форм, работа с CRM, выгрузка отчётов, перемещение данных между сервисами.

Где это особенно полезно:

сложные, многошаговые задачи, где раньше приходилось вручную кликать по интерфейсу;
ситуации, когда API нет или оно ограничено, а браузерный интерфейс — единственный вариант.

Где не стоит рассчитывать на чудо:

критически важные операции с деньгами и юридическими документами без человеческой проверки;
интерфейсы, которые часто меняются или ведут себя нестабильно;
задачи, где ошибка в один клик может стоить слишком дорого.

Ещё один важный момент: доступ к Claude и его функциям computer use в России официально ограничен. Для работы скорее всего понадобится VPN и аккаунт в поддерживаемом регионе. Anthropic об этом прямо не пишет, но по факту сервис ориентирован на рынки, где компания официально работает.

Если вы инженер или продакт и думаете о карьере, Anthropic отдельно зовёт людей в инженерную команду — на сайте компании есть раздел с вакансиями.

Место на рынке

Anthropic напрямую не сравнивает Claude Sonnet 4.6 с конкурентами вроде GPT-4o или других ассистентов, которые тоже умеют управлять браузером и приложениями. Компания даёт только один числовой ориентир — 72,5% на OSWorld против менее 15% в конце 2024 года у собственных же Sonnet-моделей.

OSWorld — один из стандартных бенчмарков для «компьютерных» ассистентов. Но без открытых цифр по GPT-4o, Gemini и другим системам честное сравнение по скорости, качеству и цене пока невозможно.

Из фактов, которые можно зафиксировать:

Anthropic последовательно собирает команды под computer use: до Vercept компания уже купила Bun.
Фокус — не только на качестве ответов в чате, но и на реальной работе в софте: от браузера до сложных интерфейсов.

Для бизнеса и продвинутых пользователей это сигнал: Anthropic всерьёз инвестирует в ассистента, который умеет не только «думать», но и «кликать». Но выбор между Claude, GPT-4o и другими ассистентами по-прежнему придётся делать на своём стенде и своих задачах — общедоступных честных сравнений пока нет.