- Дата публикации
Microsoft прокачала Copilot Studio: компьютерные агенты теперь с Cloud PC, логами и безопасными логинами
Что нового
Microsoft обновила компьютер‑использующие агенты (Computer‑Using Agents, CUA) в Copilot Studio. Главные изменения:
-
Выбор базовой модели для агента
- Поддержка нескольких foundation‑моделей:
- OpenAI Computer‑Using Agent — для сложных многошаговых сценариев в вебе и на десктопе.
- Anthropic Claude Sonnet 4.5 — для задач, где важна точная работа с динамическими интерфейсами и плотными дашбордами.
- Для каждого агента можно выбрать модель под конкретный интерфейс и задачу.
- Поддержка нескольких foundation‑моделей:
-
Безопасная аутентификация с встроенными credential‑ами
- Встроенное хранение учетных данных для веб‑сайтов и десктопных приложений.
- Повторное использование одних и тех же credential‑ов в разных агентах и сценариях.
- Полностью без участия человека: агенты логинятся сами, без всплывающих запросов пароля во время запуска.
- Два варианта хранения:
- Внутреннее хранилище Microsoft Power Platform (шифрование по умолчанию) — для быстрого старта.
- Azure Key Vault — для корпоративного управления секретами.
- Учетные данные шифруются и не передаются в AI‑модель, к ним имеют доступ только авторизованные агенты.
-
Наблюдаемость: session replay и расширенные аудиторские логи
- Session replay с скриншотами каждого шага.
- Подробный лог действий:
- тип действия,
- координаты клика или элемента,
- таймстемпы,
- контекст шага.
- Сводка прогона:
- текст инструкции,
- общая длительность,
- количество действий,
- среднее время на действие,
- количество эскалаций человеку.
- Трекинг ресурсов:
- какие сайты и десктоп‑приложения использовал агент,
- какие credential‑ы применялись.
- Экспорт логов и реплея для офлайн‑разбора и аудита.
- Интеграция с Microsoft Purview для отправки аудиторских логов.
- Логирование в Dataverse с уровнем детализации на выбор:
- All data — все данные со скриншотами,
- Data without screenshots — без изображений,
- Minimal — только минимум для трекинга.
- Настройка срока хранения: от 7 дней до бессрочно — под требования регуляторов и внутренней политики.
-
Cloud PC‑пулы на базе Windows 365 for Agents
- Пулы управляемых облачных ПК специально для запусков CUA.
- Машины уже:
- Microsoft Entra joined,
- Intune enrolled.
- Масштабируемая емкость под всплески нагрузки: можно прогонять много сценариев без собственного «зоопарка» виртуалок.
- Пилотирование:
- до двух Cloud PC‑пулов на один tenant,
- 50 часов бесплатного использования для опубликованных автономных агентов.
-
Интеграция с существующей автоматизацией
- CUA не заменяют Power Automate и RPA, а дополняют их.
- Классический RPA остаётся для стабильных интерфейсов и детерминированной логики.
- CUA берут на себя:
- часто меняющиеся интерфейсы,
- отсутствие API,
- сложные решения «по ситуации».
Как это работает
Модели: OpenAI Computer‑Using Agent и Claude Sonnet 4.5
Copilot Studio позволяет для каждого агента выборать foundation‑модель.
-
OpenAI Computer‑Using Agent:
- Управляет многошаговыми сценариями: открывает сайты, кликает по элементам, заполняет формы, переключается между окнами.
- Подходит, когда нужно оркестрировать длинные цепочки действий и комбинировать веб и десктоп.
-
Anthropic Claude Sonnet 4.5:
- Оптимален для динамичных интерфейсов: часто меняющиеся дашборды, сложные панели управления, нестабильные вёрстки.
- Делает упор на точное «чтение» сложных UI и интерпретацию плотных экранов с большим количеством данных.
Архитектурно CUA работают как прослойка между моделью и реальным компьютером:
- Модель получает задание в виде текста и доступ к виртуальному рабочему столу.
- Агент видит интерфейс (скриншоты, структуру окна) и принимает решение, куда кликнуть, что ввести, что прочитать.
- Движок CUA переводит эти решения в реальные действия: клики, ввод текста, переключение окон.
- Все шаги логируются и могут быть воспроизведены через session replay.
Аутентификация и хранение credential‑ов
Встроенные credential‑ы работают как централизованное хранилище логинов для агентов:
- Администратор или автор агента создаёт credential‑запись (логин/пароль, токен и т. п.).
- Credential сохраняется либо во внутреннем хранилище Power Platform, либо в Azure Key Vault.
- Агент при запуске использует нужный credential, чтобы залогиниться в веб‑портал или десктоп‑приложение.
- Модель не видит сами секреты: она только получает результат логина и состояние UI.
Пример из сценариев Microsoft: агент каждую ночь заходит в портал поставщика и обновляет данные в десктопной ERP‑системе. Теперь логины к обоим системам хранятся в credential‑ах, и агент сам проходит авторизацию без участия человека.
Наблюдаемость и аудит
Система мониторинга CUA строится вокруг трёх слоёв:
-
Session replay
- Для каждого прогона сохраняются скриншоты.
- Можно посмотреть, как агент видел интерфейс на каждом шаге.
-
Action log
- Для каждого шага фиксируется:
- тип действия (клик, ввод текста, навигация и т. д.),
- координаты и контекст элемента,
- время выполнения.
- Для каждого шага фиксируется:
-
Run summary и ресурсный отчёт
- Краткая статистика прогона: сколько длился, сколько было шагов, как часто агент звал человека на помощь.
- Список сайтов, приложений и credential‑ов, которые участвовали в сценарии.
Эти данные можно:
- смотреть прямо в интерфейсе Copilot Studio,
- отправлять в Microsoft Purview,
- хранить в Dataverse с нужным уровнем детализации,
- экспортировать для внешнего аудита.
Cloud PC‑пулы для CUA
Cloud PC‑пулы — это набор управляемых виртуальных машин Windows 365 for Agents, на которых запускаются агенты.
Что происходит под капотом:
- Вы создаёте пул Cloud PC в Copilot Studio.
- Microsoft разворачивает нужное количество Windows‑машин в облаке.
- Эти машины уже подключены к Microsoft Entra и управляются через Intune.
- Когда запускается агент, Copilot Studio распределяет его по свободной машине из пула.
- При пиках нагрузки можно масштабировать пул, а когда нагрузки нет — не платить за простаивающее железо у себя.
Для пилота Microsoft даёт:
- до двух пулов на один tenant,
- 50 часов бесплатного времени для опубликованных автономных агентов.
Что это значит для вас
Когда CUA действительно полезны
1. Автоматизация через UI, когда API нет или они сырые
Если у вас:
- старые ERP/CRM,
- ведомственные порталы,
- «самописные» системы без API, то CUA могут закрыть рутину за счёт работы с интерфейсом как человек.
Примеры задач:
- выгрузка отчётов из старого веб‑портала с последующей загрузкой в другую систему;
- ночные обновления записей в десктопной базе;
- массовая обработка форм в динамичном веб‑интерфейсе.
2. Часто меняющиеся веб‑интерфейсы
Классический RPA ломается каждый раз, когда фронтенд‑команда меняет классы, разметку или расположение полей.
Схема, которую предлагает Microsoft:
- оставить существующий RPA там, где всё стабильно;
- отдать CUA участки, где UI постоянно меняется.
Это уменьшает объём ручной поддержки скриптов и делает сценарии более живучими.
3. Сложные дашборды и панели мониторинга
Claude Sonnet 4.5 в CUA полезен, если:
- у вас BI‑дашборды с кучей метрик;
- интерфейс меняется в зависимости от фильтров и ролей;
- нужно не только кликать, но и «понимать», что показывает экран.
Агент может:
- ориентироваться в плотном UI,
- считывать значения и статусы,
- принимать решения дальше по сценарию.
4. Ночные и массовые прогоны без присутствия человека
Встроенные credential‑ы и Cloud PC‑пулы позволяют запускать сценарии без «дежурного у экрана»:
- нет ручного ввода пароля;
- нет необходимости держать включённые физические машины;
- можно масштабировать число одновременных прогонов.
Где CUA не подойдут
-
Жёстко регламентированные процессы с нулевой терпимостью к ошибкам
- Если регулятор требует 100% предсказуемости и валидации каждого шага, классический RPA или скрипты могут быть безопаснее.
- CUA всё равно полагаются на интерпретацию интерфейса AI‑моделью.
-
Стабильные интерфейсы с доступным API
- Если у системы есть полноценный API, логичнее строить интеграции через него.
- CUA через UI в таком случае будут медленнее и хрупче, чем прямой API‑запрос.
-
Сценарии, где нельзя писать скриншоты и логи UI
- Session replay и скриншоты — это плюс для аудита, но риск для конфиденциальности, если на экране PII или чувствительные данные.
- В таких сценариях придётся жёстко настраивать уровень логирования (например, без скриншотов) и политику хранения.
Доступность и ограничения для России
Copilot Studio и компьютер‑использующие агенты официально доступны в US‑based окружениях.
Для пользователей и компаний из России это означает:
- возможные юридические и регуляторные ограничения при работе с облаком Microsoft за пределами страны;
- риск блокировок и ограничений доступа на сетевом уровне;
- потенциальную необходимость VPN или прокси для стабильной работы.
Перед внедрением CUA в России придётся:
- согласовать использование зарубежного облака с юристами и службой безопасности;
- учесть требования к локализации персональных данных;
- проверить, не конфликтует ли это с отраслевыми регуляциями.
Место на рынке
По типу продукта
CUA в Copilot Studio находятся на пересечении трёх классов решений:
- классический RPA (UiPath, Automation Anywhere, Power Automate Desktop);
- «агенты» на базе LLM, которые работают с UI (например, экспериментальные агенты на GPT‑4o или Claude 3 через браузер);
- корпоративные платформы автоматизации (Microsoft Power Platform).
Ключевое отличие — тесная связка с экосистемой Microsoft:
- Power Platform и Dataverse для хранения и логов;
- Microsoft Purview для аудита;
- Windows 365 и Cloud PC для инфраструктуры;
- Microsoft Entra и Intune для управления доступом и устройствами.
Сравнение по параметрам
В исходных данных нет конкретных цифр по скорости, цене или качеству против других LLM‑агентов, поэтому можно опираться только на архитектуру и функциональность:
-
Инфраструктура
- CUA: готовые Cloud PC‑пулы на Windows 365, Entra + Intune из коробки.
- Классические RPA: часто требуют собственных серверов/виртуалок и отдельной настройки доменной интеграции.
-
Гибкость по моделям
- CUA: выбор между OpenAI Computer‑Using Agent и Claude Sonnet 4.5 внутри одного продукта.
- Многие конкуренты завязаны на одного вендора LLM или требуют ручной интеграции нескольких.
-
Наблюдаемость и аудит
- CUA: session replay, скриншоты, координаты кликов, экспорт, Purview, Dataverse, настройка retention до «навсегда».
- У классического RPA обычно есть логи и скриншоты, но интеграция с Purview и единая политика хранения для AI‑агентов — преимущество Microsoft‑стека.
-
Интеграция с существующей автоматизацией
- CUA естественно встраиваются в Power Automate и Power Platform.
- Если у вас уже выстроена автоматизация на UiPath или другом RPA, придётся интегрировать CUA через сторонние коннекторы или API.
Если у компании уже есть Microsoft 365, Power Platform, Entra, Intune и Windows 365, CUA выглядят логичным расширением существующей инфраструктуры. Если стек другой, внедрение потребует больше интеграционной работы.
Как запустить
Чтобы попробовать компьютер‑использующие агенты в Copilot Studio (в US‑окружении):
-
Создайте или откройте агента
- Зайдите в Microsoft Copilot Studio.
- Создайте нового агента или выберите существующего.
-
Подключите инструмент computer use
- В интерфейсе агента перейдите в раздел Tools.
- Нажмите Add tool → New tool.
- Выберите computer use.
-
Опишите задачу на естественном языке
- Введите, что именно должен делать агент:
- какие сайты открывать,
- какие формы заполнять,
- какие данные читать и куда переносить.
- Введите, что именно должен делать агент:
-
(Опционально) Выберите модель и настройте credential‑ы
- Укажите, будете ли использовать OpenAI Computer‑Using Agent или Claude Sonnet 4.5.
- Создайте и привяжите встроенные credential‑ы для нужных сайтов и приложений.
-
(Опционально) Настройте Cloud PC‑пул
- Создайте пул Cloud PC на базе Windows 365 for Agents.
- Определите размер пула и политики использования.
-
Запустите прогон и посмотрите логи
- Запустите агента.
- После выполнения откройте session replay, action log и сводку прогона.
- При необходимости экспортируйте данные или отправьте их в Purview.
Подробные инструкции по конфигурации и best practices Microsoft собрала в документации по computer use. Для продуктивного использования CUA имеет смысл сразу подключить команду безопасности и compliance: им пригодятся настройки логирования, retention и Purview‑интеграция.