Microsoft расширяет Azure API Management: единый вход для API, моделей, агентов и MCP-инструментов — VogueTech

Что нового

Microsoft на Build 2026 сильно перетрясла Azure API Management и Azure API Center под задачи AI‑продуктов и агентных систем. Главное:

Azure API Center — общий каталог для API и AI‑активов (GA)
- Регистрация не только API, но и агентов, MCP‑инструментов, промптов, скиллов и AI‑сервисов.
- Синхронизация описаний агентов из Git‑репозиториев.
- Автоматическая оценка агентов по схеме LLM-as-a-Judge до публикации в каталоге.
- Общий MCP‑сервер для data plane: единая точка обнаружения MCP‑серверов, тулов, API, агентов и AI‑активов через один MCP‑коннект.
Agent-to-Agent API и контент‑безопасность для агентов (GA)
- Поддержка JSON‑RPC‑основанных Agent‑to‑Agent (A2A) API в Azure API Management.
- Единая политика безопасности и контент‑фильтрации для:
  - вызовов моделей,
  - MCP‑инструментов,
  - взаимодействия агентов друг с другом.
Unified Model API для мультимодельных AI‑приложений (Public Preview)
- Один клиентский API поверх нескольких провайдеров моделей: Microsoft, OpenAI, Anthropic, Google и других.
- Azure API Management берет на себя трансформацию запросов/ответов под конкретный API провайдера.
- Возможность маршрутизации трафика между провайдерами, фейловер и эволюция набора моделей без переписывания приложений.
Расширенный AI Gateway: поддержка Anthropic и Google Vertex AI (GA)
- Те же политики и наблюдаемость, что были для других моделей, теперь распространяются и на Anthropic, и на Google Vertex AI.
- Поддержка:
  - рантайм‑губернанса,
  - безопасности,
  - контент‑фильтрации,
  - семантического кэша,
  - токен‑лимитов,
  - логирования, трейсинга и метрик.
Расширенная наблюдаемость по токенам для AI‑нагрузок (GA)
- Метрики по всем типам токенов, не только prompt и completion.
- Поддержка cached, reasoning и thinking‑токенов.
- Выгрузка метрик в Application Insights для дашбордов стоимости и мониторинга бюджета.
Энтерпрайз‑улучшения платформы (GA)
- Premium v2: поддержка нескольких кастомных доменов для API, девпортала и management‑эндпоинтов с разными брендами.
- Premium v2 и Standard v2: поддержка wildcard‑хостнеймов, упрощающее управление сертификатами и DNS для большого числа API.
- Расширение workspaces на встроенный gateway:
  - командная модель управления API,
  - делегированное управление по командам/подразделениям,
  - при этом сохраняются multi‑region деплой, кастомные хостнеймы и Private Link.

Как это работает

Централизованный каталог для API, агентов и MCP

Azure API Center превращается в единый реестр цифровых активов:

Регистрация агентов: разработчик описывает агента (способности, входы/выходы, ограничения) и регистрирует его так же, как REST‑ или GraphQL‑API. Агент появляется в общем каталоге рядом с API и MCP‑инструментами.
Git‑синхронизация: описания агентов и API хранятся в репозитории. API Center подтягивает их автоматически, чтобы каталог всегда совпадал с кодовой базой. Это устраняет рассинхрон между документацией и реализацией.
LLM-as-a-Judge: перед публикацией агент прогоняется через LLM‑оценку. Модель проверяет сценарии безопасности, предсказуемость поведения и полноту ответов. Результат — автоматический скоринг и отчеты, которые можно использовать как gate в CI/CD.

MCP‑сервер Azure API Center для data plane

Azure API Center поднимает MCP‑сервер, который выступает единым discovery‑эндпоинтом:

Агент или инструмент подключается к одному MCP‑серверу Azure.
Через него он видит все зарегистрированные:
- MCP‑серверы,
- MCP‑инструменты,
- API,
- агентов,
- AI‑сервисы.
Новые MCP‑инструменты, добавленные в API Center, автоматически становятся доступны всем клиентам, подключенным к этому MCP‑серверу — без их перенастройки.

Agent-to-Agent API и безопасность

Azure API Management добавляет поддержку JSON‑RPC‑ориентированных A2A‑API:

Взаимодействие агентов переводится в формальные JSON‑RPC‑эндпоинты.
Эти эндпоинты попадают под те же политики, что и REST/GraphQL/MCP/API моделей:
- аутентификация и авторизация,
- rate limiting,
- логирование и трейсинг,
- контент‑безопасность.
Контент‑фильтрация теперь применяется не только к запросам к модели, но и к:
- payload MCP‑инструментов,
- сообщениям между агентами.

Unified Model API

Unified Model API работает как прослойка в Azure API Management:

Клиент общается с единым API‑форматом (единая схема запроса/ответа, единые SDK).
Внутри Azure API Management настраиваются маршруты и трансформации под конкретных провайдеров:
- Microsoft‑модели,
- GPT‑линейка от OpenAI,
- Claude‑линейка от Anthropic,
- модели в Google Vertex AI,
- другие совместимые провайдеры.
Платформа:
- маппит поля между разными форматами запросов,
- управляет ключами и эндпоинтами провайдеров,
- может динамически переключать провайдера по правилам (стоимость, задержка, регион, отказ).

Для клиента всё выглядит как работа с одной моделью, хотя под капотом может работать несколько разных.

AI Gateway для Anthropic и Vertex AI

AI Gateway в Azure API Management уже умел проксировать запросы к моделям разных вендоров. Теперь он:

понимает эндпоинты Anthropic и Google Vertex AI,
применяет к ним те же политики, что и к другим моделям:
- проверка токенов и лимитов,
- семантический кэш (повторные похожие запросы можно обслуживать быстрее и дешевле),
- централизованный лог и трейс,
- контент‑безопасность.

Токены: cached, reasoning, thinking

Модели вводят новые типы токенов, и Azure API Management учитывает их в метриках:

cached tokens — когда провайдер использует кэш префикса или семантический кэш;
reasoning tokens — токены, потраченные на внутренние рассуждения модели;
thinking tokens — расширенные режимы размышлений (названия зависят от провайдера, но Azure собирает их как отдельные категории).

Все эти метрики уходят в Application Insights, где можно:

строить дашборды по стоимости и потреблению,
отслеживать аномалии (резкий рост reasoning‑токенов),
привязывать бюджеты к конкретным приложениям и командам.

Улучшения платформы для энтерпрайза

Несколько кастомных доменов (Premium v2): один кластер Azure API Management может одновременно обслуживать, например, api.brand1.com, api.brand2.com и отдельный домен для девпортала, при этом управляется из одной точки.
Wildcard‑хостнеймы (Premium v2, Standard v2): можно повесить один сертификат на *.api.company.com и динамически добавлять новые поддомены для микросервисов без ручного управления каждым сертификатом.
Workspaces для встроенного gateway: командная модель управления API теперь работает и на встроенном шлюзе, а не только на self-hosted вариантах. Это позволяет:
- делегировать управление API конкретным командам,
- при этом использовать преимущества встроенного gateway: multi‑region, кастомные хостнеймы, Private Link.

Что это значит для вас

Если вы строите AI‑продукт

Мультимодельная стратегия без боли: Unified Model API позволяет комбинировать GPT‑линейку, Claude, Vertex AI и модели Microsoft без переписывания клиента. Можно:
- тестировать нескольких провайдеров параллельно,
- держать fallback на случай недоступности одного из них,
- переключаться между моделями по цене или задержке.
Управление агентами как API: агенты становятся полноценными объектами платформы. Вы можете:
- хранить их описания в Git,
- публиковать только те версии, которые прошли LLM‑оценку,
- давать к ним доступ другим командам через единый каталог.
Безопасность и комплаенс: A2A‑API под управлением Azure API Management сокращают «серые зоны», где агенты общаются напрямую без логов и политик. Это критично для финансовых, медицинских и любых регулируемых сценариев.

Если вы отвечаете за платформу или архитектуру

Единая точка governance для:
- REST/GraphQL‑API,
- MCP‑инструментов,
- AI‑моделей,
- агентов и их взаимодействий.
Не нужно плодить отдельные платформы под каждого нового вида «актива».
Проще управлять мульти‑брендом и мульти‑командой:
- несколько доменов в Premium v2 позволяют разделить бренды, но держать общую политику безопасности;
- workspaces дают командам автономию, но сохраняют централизованный контроль.
Прозрачная стоимость AI:
- детальные токен‑метрики по всем типам токенов позволяют строить честные chargeback/showback‑модели;
- можно быстро увидеть, какой продукт «сжигает» reasoning‑токены, и оптимизировать промпты или выбор моделей.

Если вы разработчик

Меньше SDK и форматов: вы работаете с одним API, а платформа разговаривает с разными провайдерами.
Единый способ подключения к MCP‑инструментам: достаточно одного MCP‑коннекта к Azure API Center, чтобы получить доступ к большому числу внутренних инструментов и API.
Понятный цикл разработки агентов:
- описали агента в репозитории,
- прогнали через автоматическую оценку,
- опубликовали в API Center,
- подключили к нему другие агенты и приложения через стандартные A2A‑API.

Где это не сработает

Если вы делаете маленький pet‑project на одной публичной модели, без требований к комплаенсу и учету стоимости, весь этот стек будет избыточен.
Если у вас нет доступа к Azure или ваша организация не может использовать облако Microsoft по юридическим причинам, эти обновления вам недоступны.
Для пользователей из России: доступ к Azure и связанным сервисам может быть ограничен. В большинстве случаев потребуется корпоративный контракт и/или VPN, а также юрлицо вне РФ. Нужно проверять актуальные условия Microsoft для вашей юрисдикции.

Место на рынке

Azure API Management и Azure API Center занимают нишу governance‑платформы для API и AI‑активов. В контексте конкурентов:

По функциональности это ближе всего к связке «API‑шлюз + AI‑прокси + каталог сервисов» у других облаков.
Microsoft делает ставку на:
- поддержку нескольких AI‑провайдеров в одном AI Gateway (включая Anthropic и Google Vertex AI),
- Unified Model API как единый слой абстракции над моделями разных вендоров,
- глубокую интеграцию с MCP‑экосистемой и агентными сценариями (MCP‑сервер, регистрация агентов, A2A‑API).

Прямых числовых сравнений по скорости, стоимости запросов или лимитам контекста с конкурентами Microsoft не приводит. Здесь фокус не на перформансе моделей, а на управляемости, наблюдаемости и архитектуре мультимодельных и агентных систем.

Если вам важны именно эти аспекты — единый слой управления для API, моделей, агентов и MCP‑инструментов — обновления Azure API Management и Azure API Center закрывают большую часть таких задач из коробки.