Дата публикации
ai_products

Microsoft прокачала Copilot Studio: компьютерные агенты теперь с Cloud PC, логами и безопасными логинами

Что нового

Microsoft обновила компьютер‑использующие агенты (Computer‑Using Agents, CUA) в Copilot Studio. Главные изменения:

  1. Выбор базовой модели для агента

    • Поддержка нескольких foundation‑моделей:
      • OpenAI Computer‑Using Agent — для сложных многошаговых сценариев в вебе и на десктопе.
      • Anthropic Claude Sonnet 4.5 — для задач, где важна точная работа с динамическими интерфейсами и плотными дашбордами.
    • Для каждого агента можно выбрать модель под конкретный интерфейс и задачу.
  2. Безопасная аутентификация с встроенными credential‑ами

    • Встроенное хранение учетных данных для веб‑сайтов и десктопных приложений.
    • Повторное использование одних и тех же credential‑ов в разных агентах и сценариях.
    • Полностью без участия человека: агенты логинятся сами, без всплывающих запросов пароля во время запуска.
    • Два варианта хранения:
      • Внутреннее хранилище Microsoft Power Platform (шифрование по умолчанию) — для быстрого старта.
      • Azure Key Vault — для корпоративного управления секретами.
    • Учетные данные шифруются и не передаются в AI‑модель, к ним имеют доступ только авторизованные агенты.
  3. Наблюдаемость: session replay и расширенные аудиторские логи

    • Session replay с скриншотами каждого шага.
    • Подробный лог действий:
      • тип действия,
      • координаты клика или элемента,
      • таймстемпы,
      • контекст шага.
    • Сводка прогона:
      • текст инструкции,
      • общая длительность,
      • количество действий,
      • среднее время на действие,
      • количество эскалаций человеку.
    • Трекинг ресурсов:
      • какие сайты и десктоп‑приложения использовал агент,
      • какие credential‑ы применялись.
    • Экспорт логов и реплея для офлайн‑разбора и аудита.
    • Интеграция с Microsoft Purview для отправки аудиторских логов.
    • Логирование в Dataverse с уровнем детализации на выбор:
      • All data — все данные со скриншотами,
      • Data without screenshots — без изображений,
      • Minimal — только минимум для трекинга.
    • Настройка срока хранения: от 7 дней до бессрочно — под требования регуляторов и внутренней политики.
  4. Cloud PC‑пулы на базе Windows 365 for Agents

    • Пулы управляемых облачных ПК специально для запусков CUA.
    • Машины уже:
      • Microsoft Entra joined,
      • Intune enrolled.
    • Масштабируемая емкость под всплески нагрузки: можно прогонять много сценариев без собственного «зоопарка» виртуалок.
    • Пилотирование:
      • до двух Cloud PC‑пулов на один tenant,
      • 50 часов бесплатного использования для опубликованных автономных агентов.
  5. Интеграция с существующей автоматизацией

    • CUA не заменяют Power Automate и RPA, а дополняют их.
    • Классический RPA остаётся для стабильных интерфейсов и детерминированной логики.
    • CUA берут на себя:
      • часто меняющиеся интерфейсы,
      • отсутствие API,
      • сложные решения «по ситуации».

Как это работает

Модели: OpenAI Computer‑Using Agent и Claude Sonnet 4.5

Copilot Studio позволяет для каждого агента выборать foundation‑модель.

  • OpenAI Computer‑Using Agent:

    • Управляет многошаговыми сценариями: открывает сайты, кликает по элементам, заполняет формы, переключается между окнами.
    • Подходит, когда нужно оркестрировать длинные цепочки действий и комбинировать веб и десктоп.
  • Anthropic Claude Sonnet 4.5:

    • Оптимален для динамичных интерфейсов: часто меняющиеся дашборды, сложные панели управления, нестабильные вёрстки.
    • Делает упор на точное «чтение» сложных UI и интерпретацию плотных экранов с большим количеством данных.

Архитектурно CUA работают как прослойка между моделью и реальным компьютером:

  1. Модель получает задание в виде текста и доступ к виртуальному рабочему столу.
  2. Агент видит интерфейс (скриншоты, структуру окна) и принимает решение, куда кликнуть, что ввести, что прочитать.
  3. Движок CUA переводит эти решения в реальные действия: клики, ввод текста, переключение окон.
  4. Все шаги логируются и могут быть воспроизведены через session replay.

Аутентификация и хранение credential‑ов

Встроенные credential‑ы работают как централизованное хранилище логинов для агентов:

  1. Администратор или автор агента создаёт credential‑запись (логин/пароль, токен и т. п.).
  2. Credential сохраняется либо во внутреннем хранилище Power Platform, либо в Azure Key Vault.
  3. Агент при запуске использует нужный credential, чтобы залогиниться в веб‑портал или десктоп‑приложение.
  4. Модель не видит сами секреты: она только получает результат логина и состояние UI.

Пример из сценариев Microsoft: агент каждую ночь заходит в портал поставщика и обновляет данные в десктопной ERP‑системе. Теперь логины к обоим системам хранятся в credential‑ах, и агент сам проходит авторизацию без участия человека.

Наблюдаемость и аудит

Система мониторинга CUA строится вокруг трёх слоёв:

  1. Session replay

    • Для каждого прогона сохраняются скриншоты.
    • Можно посмотреть, как агент видел интерфейс на каждом шаге.
  2. Action log

    • Для каждого шага фиксируется:
      • тип действия (клик, ввод текста, навигация и т. д.),
      • координаты и контекст элемента,
      • время выполнения.
  3. Run summary и ресурсный отчёт

    • Краткая статистика прогона: сколько длился, сколько было шагов, как часто агент звал человека на помощь.
    • Список сайтов, приложений и credential‑ов, которые участвовали в сценарии.

Эти данные можно:

  • смотреть прямо в интерфейсе Copilot Studio,
  • отправлять в Microsoft Purview,
  • хранить в Dataverse с нужным уровнем детализации,
  • экспортировать для внешнего аудита.

Cloud PC‑пулы для CUA

Cloud PC‑пулы — это набор управляемых виртуальных машин Windows 365 for Agents, на которых запускаются агенты.

Что происходит под капотом:

  1. Вы создаёте пул Cloud PC в Copilot Studio.
  2. Microsoft разворачивает нужное количество Windows‑машин в облаке.
  3. Эти машины уже подключены к Microsoft Entra и управляются через Intune.
  4. Когда запускается агент, Copilot Studio распределяет его по свободной машине из пула.
  5. При пиках нагрузки можно масштабировать пул, а когда нагрузки нет — не платить за простаивающее железо у себя.

Для пилота Microsoft даёт:

  • до двух пулов на один tenant,
  • 50 часов бесплатного времени для опубликованных автономных агентов.

Что это значит для вас

Когда CUA действительно полезны

1. Автоматизация через UI, когда API нет или они сырые

Если у вас:

  • старые ERP/CRM,
  • ведомственные порталы,
  • «самописные» системы без API, то CUA могут закрыть рутину за счёт работы с интерфейсом как человек.

Примеры задач:

  • выгрузка отчётов из старого веб‑портала с последующей загрузкой в другую систему;
  • ночные обновления записей в десктопной базе;
  • массовая обработка форм в динамичном веб‑интерфейсе.

2. Часто меняющиеся веб‑интерфейсы

Классический RPA ломается каждый раз, когда фронтенд‑команда меняет классы, разметку или расположение полей.

Схема, которую предлагает Microsoft:

  • оставить существующий RPA там, где всё стабильно;
  • отдать CUA участки, где UI постоянно меняется.

Это уменьшает объём ручной поддержки скриптов и делает сценарии более живучими.

3. Сложные дашборды и панели мониторинга

Claude Sonnet 4.5 в CUA полезен, если:

  • у вас BI‑дашборды с кучей метрик;
  • интерфейс меняется в зависимости от фильтров и ролей;
  • нужно не только кликать, но и «понимать», что показывает экран.

Агент может:

  • ориентироваться в плотном UI,
  • считывать значения и статусы,
  • принимать решения дальше по сценарию.

4. Ночные и массовые прогоны без присутствия человека

Встроенные credential‑ы и Cloud PC‑пулы позволяют запускать сценарии без «дежурного у экрана»:

  • нет ручного ввода пароля;
  • нет необходимости держать включённые физические машины;
  • можно масштабировать число одновременных прогонов.

Где CUA не подойдут

  1. Жёстко регламентированные процессы с нулевой терпимостью к ошибкам

    • Если регулятор требует 100% предсказуемости и валидации каждого шага, классический RPA или скрипты могут быть безопаснее.
    • CUA всё равно полагаются на интерпретацию интерфейса AI‑моделью.
  2. Стабильные интерфейсы с доступным API

    • Если у системы есть полноценный API, логичнее строить интеграции через него.
    • CUA через UI в таком случае будут медленнее и хрупче, чем прямой API‑запрос.
  3. Сценарии, где нельзя писать скриншоты и логи UI

    • Session replay и скриншоты — это плюс для аудита, но риск для конфиденциальности, если на экране PII или чувствительные данные.
    • В таких сценариях придётся жёстко настраивать уровень логирования (например, без скриншотов) и политику хранения.

Доступность и ограничения для России

Copilot Studio и компьютер‑использующие агенты официально доступны в US‑based окружениях.

Для пользователей и компаний из России это означает:

  • возможные юридические и регуляторные ограничения при работе с облаком Microsoft за пределами страны;
  • риск блокировок и ограничений доступа на сетевом уровне;
  • потенциальную необходимость VPN или прокси для стабильной работы.

Перед внедрением CUA в России придётся:

  • согласовать использование зарубежного облака с юристами и службой безопасности;
  • учесть требования к локализации персональных данных;
  • проверить, не конфликтует ли это с отраслевыми регуляциями.

Место на рынке

По типу продукта

CUA в Copilot Studio находятся на пересечении трёх классов решений:

  • классический RPA (UiPath, Automation Anywhere, Power Automate Desktop);
  • «агенты» на базе LLM, которые работают с UI (например, экспериментальные агенты на GPT‑4o или Claude 3 через браузер);
  • корпоративные платформы автоматизации (Microsoft Power Platform).

Ключевое отличие — тесная связка с экосистемой Microsoft:

  • Power Platform и Dataverse для хранения и логов;
  • Microsoft Purview для аудита;
  • Windows 365 и Cloud PC для инфраструктуры;
  • Microsoft Entra и Intune для управления доступом и устройствами.

Сравнение по параметрам

В исходных данных нет конкретных цифр по скорости, цене или качеству против других LLM‑агентов, поэтому можно опираться только на архитектуру и функциональность:

  • Инфраструктура

    • CUA: готовые Cloud PC‑пулы на Windows 365, Entra + Intune из коробки.
    • Классические RPA: часто требуют собственных серверов/виртуалок и отдельной настройки доменной интеграции.
  • Гибкость по моделям

    • CUA: выбор между OpenAI Computer‑Using Agent и Claude Sonnet 4.5 внутри одного продукта.
    • Многие конкуренты завязаны на одного вендора LLM или требуют ручной интеграции нескольких.
  • Наблюдаемость и аудит

    • CUA: session replay, скриншоты, координаты кликов, экспорт, Purview, Dataverse, настройка retention до «навсегда».
    • У классического RPA обычно есть логи и скриншоты, но интеграция с Purview и единая политика хранения для AI‑агентов — преимущество Microsoft‑стека.
  • Интеграция с существующей автоматизацией

    • CUA естественно встраиваются в Power Automate и Power Platform.
    • Если у вас уже выстроена автоматизация на UiPath или другом RPA, придётся интегрировать CUA через сторонние коннекторы или API.

Если у компании уже есть Microsoft 365, Power Platform, Entra, Intune и Windows 365, CUA выглядят логичным расширением существующей инфраструктуры. Если стек другой, внедрение потребует больше интеграционной работы.

Как запустить

Чтобы попробовать компьютер‑использующие агенты в Copilot Studio (в US‑окружении):

  1. Создайте или откройте агента

    • Зайдите в Microsoft Copilot Studio.
    • Создайте нового агента или выберите существующего.
  2. Подключите инструмент computer use

    • В интерфейсе агента перейдите в раздел Tools.
    • Нажмите Add tool → New tool.
    • Выберите computer use.
  3. Опишите задачу на естественном языке

    • Введите, что именно должен делать агент:
      • какие сайты открывать,
      • какие формы заполнять,
      • какие данные читать и куда переносить.
  4. (Опционально) Выберите модель и настройте credential‑ы

    • Укажите, будете ли использовать OpenAI Computer‑Using Agent или Claude Sonnet 4.5.
    • Создайте и привяжите встроенные credential‑ы для нужных сайтов и приложений.
  5. (Опционально) Настройте Cloud PC‑пул

    • Создайте пул Cloud PC на базе Windows 365 for Agents.
    • Определите размер пула и политики использования.
  6. Запустите прогон и посмотрите логи

    • Запустите агента.
    • После выполнения откройте session replay, action log и сводку прогона.
    • При необходимости экспортируйте данные или отправьте их в Purview.

Подробные инструкции по конфигурации и best practices Microsoft собрала в документации по computer use. Для продуктивного использования CUA имеет смысл сразу подключить команду безопасности и compliance: им пригодятся настройки логирования, retention и Purview‑интеграция.


Читайте также

Microsoft прокачала Copilot Studio: компьютерные агенты теперь с Cloud PC, логами и безопасными логинами — VogueTech | VogueTech