Дата публикации
ai_products

Holo3: агент, который сам работает за компьютером вместо вас

Что появилось / что изменилось

Hugging Face представила линейку Holo3 — агенты, которые управляют обычным десктопом почти как человек. Фокус не на болтовне, а на реальной работе с интерфейсами.

Главная цифра: Holo3-122B-A10B набрал 78,85% на бенчмарке OSWorld-Verified. Это сейчас один из ключевых тестов на умение модели пользоваться компьютером: кликать по интерфейсу, заполнять формы, переключаться между окнами.

Архитектура у флагмана гибридная: 122 миллиардов параметров всего, но активно при инференсе используется только 10 миллиардов. Это снижает стоимость вычислений по сравнению с гигантами вроде GPT 5.4 или Opus 4.6.

Запуск:

  • все модели Holo3 доступны через Inference API Hugging Face;
  • Holo3-35B-A3B можно скачать напрямую: веса выложены на Hugging Face под лицензией Apache 2.0;
  • тот же Holo3-35B-A3B доступен и через облачный inference с бесплатным тарифом.

Для оценки «боевой готовности» Hugging Face собрала свой набор H Corporate Benchmarks — 486 многошаговых задач. Они покрывают четыре категории: e-commerce, бизнес‑ПО, коллаборация и сценарии с несколькими приложениями.

На задачах с одним приложением Holo3 показывает заметно более высокую успешность, чем базовые модели семейства Qwen3.5 с сопоставимой или большей емкостью. Это прямой эффект специализированного обучения под компьютерное управление.

Как это работает

Holo3 тренируют не просто на текстах, а в «тренажере предприятия». Hugging Face построила агентный конвейер обучения — flywheel, который крутится по кругу и постоянно улучшает две вещи: восприятие интерфейса и принятие решений.

Основные элементы:

  1. Синтетические навигационные данные. На вход подают человеческие и сгенерированные инструкции. На их основе создают сценарии: куда кликнуть, что ввести, как найти нужный раздел. Получается большой набор пошаговых траекторий по интерфейсам.

  2. Out-of-domain аугментация. Команда намеренно «ломает» привычные сценарии. Программно расширяет задачи, добавляет неожиданные варианты интерфейсов и состояний. Цель — чтобы Holo3 не терялась при малейшем отличии от тренировочных примеров.

  3. Кураторский reinforcement learning. Каждый пример проходят через фильтры качества. Далее подключают RL: модель пробует решать задачи, получает вознаграждение за успешное выполнение, штрафы за ошибки. Это не абстрактный RL, а строго завязанный на проверяемые результаты пайплайн.

Отдельный блок — Synthetic Environment Factory. Это фабрика, где кодовые агенты Hugging Face генерируют с нуля сайты и интерфейсы под конкретные сценарии. Для каждого сценария:

  • агент пишет сайт или веб‑приложение по спецификации;
  • команда добавляет скрипты проверки, которые автоматически подтверждают, что задача решена правильно;
  • сложность варьируется от простых форм до длинных цепочек с несколькими системами.

Пример сложного сценария: агент открывает PDF с ценами на оборудование, сверяет их с бюджетом каждого сотрудника в другой системе и сам рассылает персонализированные письма с одобрением или отказом.

Что это значит для вас

Если вы строите продукты вокруг «агентов, которые работают за пользователя», Holo3 — практичный кандидат.

Где Holo3 особенно полезен:

  • автоматизация рутины в корпоративных системах: заполнение CRM, обновление карточек, перенос данных между внутренними порталами;
  • e-commerce: массовое обновление товарных карточек, проверка цен, подготовка отчетов по нескольким дашбордам;
  • офисная рутина: разбор документов, поиск цифр в PDF, сведение их в таблицу, подготовка и рассылка писем;
  • сценарии, где нужно много шагов: открыть несколько приложений, собрать данные, сверить условия, принять решение и довести дело до конца.

Holo3 хорошо подходит, если:

  • вы готовы интегрировать агента, который реально кликает по интерфейсу, а не только пишет текст;
  • вам важна стоимость — активные 10B параметров дешевле в работе, чем гиганты с полным прогоном всех весов;
  • вам нужна юридически понятная лицензия: у Holo3-35B-A3B лицензия Apache 2.0, можно встраивать в коммерческие продукты.

Где Holo3 может быть лишним:

  • если вам нужен просто чат‑бот без сложных действий в интерфейсе, дешевле взять компактную диалоговую модель;
  • если критична только генерация текста высокого качества без действий в интерфейсе, можно смотреть на специализированные LLM для текста;
  • если у вас нет контроля над окружением (случайные сайты с капчами, нестабильный UI), потребуется дополнительная обвязка, Holo3 сам по себе это не решит.

Доступ: Holo3 работает через сервисы Hugging Face. Для пользователей из России может потребоваться VPN и обход ограничений доступа к зарубежным платформам.

Место на рынке

Holo3 играет в сегменте «компьютерных агентов», которые управляют обычными приложениями. Здесь сейчас соревнуются не только за качество текста, но и за точность действий и цену запуска.

По заявлению Hugging Face, Holo3 достигает 78,85% на OSWorld-Verified и при этом использует только 10B активных параметров при общем размере 122B. Для сравнения, модели уровня GPT 5.4 или Opus 4.6 требуют значительно больше ресурсов: они крупнее и дороже в эксплуатации.

На внутренних бенчмарках H Corporate Holo3 показывает лучшую успешность на задачах с одним приложением, чем базовые Qwen3.5. При этом Holo3 соблюдает те же требования к локализации и привязке к интерфейсу, но выигрывает за счет специализированного обучения через flywheel и Synthetic Environment Factory.

Holo3-35B-A3B с открытыми весами и лицензией Apache 2.0 выглядит как удобный вариант для компаний, которые не хотят завязываться на полностью закрытые решения уровня GPT 5.4 или Opus 4.6. Можно развернуть у себя, дообучить под конкретные интерфейсы и не зависеть от одного поставщика.

Слабое место — отсутствие публичных цифр по стоимости запросов и скорости на фоне тех же GPT 5.4 или Opus 4.6. Придется экспериментировать и считать экономику под свои нагрузки. Но сам подход с 10B активных параметров намекает, что эксплуатация будет заметно дешевле, чем у полноразмерных гигантов.


Читайте также

Holo3: агент, который сам работает за компьютером вместо вас — VogueTech | VogueTech