- Дата публикации
Anthropic покупает Vercept, чтобы научить Claude работать с софтом как человек
Что появилось / что изменилось
Anthropic купила стартап Vercept. Его команда целыми годами занималась тем, как научить ИИ «видеть» интерфейсы и кликать по ним, как живой пользователь.
Главный контекст — свежий релиз Claude Sonnet 4.6. Anthropic подчёркивает именно навыки работы с компьютером:
- Sonnet 4.6 научили лучше работать в живых приложениях: браузер, таблицы, формы, сложные интерфейсы.
- На бенчмарке OSWorld, который используют для оценки ИИ-ассистентов на компьютере, Sonnet-модели выросли с менее 15% в конце 2024 года до 72,5% сейчас.
- По словам Anthropic, Sonnet 4.6 уже близок к уровню человека в задачах вроде:
- навигация по сложным электронным таблицам;
- заполнение веб-форм, в том числе при переключении между вкладками браузера.
Vercept в ближайшие недели отключит свой внешний продукт. Команда полностью переезжает в Anthropic и будет развивать направление computer use внутри Claude.
Как это работает
Anthropic двигается в сторону ассистента, который не только пишет код или отвечает в чате, но и сам работает в приложениях.
Сценарий такой:
- Пользователь даёт задачу на естественном языке: например, «собери данные из этих вкладок и сведи в таблицу».
- Claude получает доступ к «живому» окружению — браузеру или другим приложениям.
- ИИ видит интерфейс примерно как человек: окна, кнопки, поля ввода, таблицы.
- Дальше он пошагово кликает, скроллит, вводит текст, переключает вкладки, проверяет результат и продолжает.
Vercept как раз занимался двумя сложными частями:
- Компьютерное зрение для интерфейсов. Распознавание кнопок, форм, таблиц, ошибок, всплывающих окон.
- Логика действий. Какой элемент нажать, в каком порядке выполнять шаги, как восстанавливаться после ошибки.
Эта экспертиза ложится прямо в текущую работу Anthropic: сделать из Claude ассистента, который умеет не только писать инструкции, но и сам выполнять многошаговые действия в реальных программах.
Что это значит для вас
Если вы уже пользуетесь Claude для работы, сценарии становятся интереснее:
- Разработка и код-ревью. Claude может не только читать репозиторий, но и работать с IDE-подобной средой: запускать тесты, править файлы, проверять результат.
- Исследования и аналитика. ИИ способен сам открыть десятки вкладок, собрать данные, свести их в одну таблицу, привести к единому формату.
- Рутина в браузере. Заполнение однотипных форм, работа с CRM, выгрузка отчётов, перемещение данных между сервисами.
Где это особенно полезно:
- сложные, многошаговые задачи, где раньше приходилось вручную кликать по интерфейсу;
- ситуации, когда API нет или оно ограничено, а браузерный интерфейс — единственный вариант.
Где не стоит рассчитывать на чудо:
- критически важные операции с деньгами и юридическими документами без человеческой проверки;
- интерфейсы, которые часто меняются или ведут себя нестабильно;
- задачи, где ошибка в один клик может стоить слишком дорого.
Ещё один важный момент: доступ к Claude и его функциям computer use в России официально ограничен. Для работы скорее всего понадобится VPN и аккаунт в поддерживаемом регионе. Anthropic об этом прямо не пишет, но по факту сервис ориентирован на рынки, где компания официально работает.
Если вы инженер или продакт и думаете о карьере, Anthropic отдельно зовёт людей в инженерную команду — на сайте компании есть раздел с вакансиями.
Место на рынке
Anthropic напрямую не сравнивает Claude Sonnet 4.6 с конкурентами вроде GPT-4o или других ассистентов, которые тоже умеют управлять браузером и приложениями. Компания даёт только один числовой ориентир — 72,5% на OSWorld против менее 15% в конце 2024 года у собственных же Sonnet-моделей.
OSWorld — один из стандартных бенчмарков для «компьютерных» ассистентов. Но без открытых цифр по GPT-4o, Gemini и другим системам честное сравнение по скорости, качеству и цене пока невозможно.
Из фактов, которые можно зафиксировать:
- Anthropic последовательно собирает команды под computer use: до Vercept компания уже купила Bun.
- Фокус — не только на качестве ответов в чате, но и на реальной работе в софте: от браузера до сложных интерфейсов.
Для бизнеса и продвинутых пользователей это сигнал: Anthropic всерьёз инвестирует в ассистента, который умеет не только «думать», но и «кликать». Но выбор между Claude, GPT-4o и другими ассистентами по-прежнему придётся делать на своём стенде и своих задачах — общедоступных честных сравнений пока нет.