- Дата публикации
Microsoft расширяет Azure API Management: единый вход для API, моделей, агентов и MCP-инструментов
Что нового
Microsoft на Build 2026 сильно перетрясла Azure API Management и Azure API Center под задачи AI‑продуктов и агентных систем. Главное:
-
Azure API Center — общий каталог для API и AI‑активов (GA)
- Регистрация не только API, но и агентов, MCP‑инструментов, промптов, скиллов и AI‑сервисов.
- Синхронизация описаний агентов из Git‑репозиториев.
- Автоматическая оценка агентов по схеме LLM-as-a-Judge до публикации в каталоге.
- Общий MCP‑сервер для data plane: единая точка обнаружения MCP‑серверов, тулов, API, агентов и AI‑активов через один MCP‑коннект.
-
Agent-to-Agent API и контент‑безопасность для агентов (GA)
- Поддержка JSON‑RPC‑основанных Agent‑to‑Agent (A2A) API в Azure API Management.
- Единая политика безопасности и контент‑фильтрации для:
- вызовов моделей,
- MCP‑инструментов,
- взаимодействия агентов друг с другом.
-
Unified Model API для мультимодельных AI‑приложений (Public Preview)
- Один клиентский API поверх нескольких провайдеров моделей: Microsoft, OpenAI, Anthropic, Google и других.
- Azure API Management берет на себя трансформацию запросов/ответов под конкретный API провайдера.
- Возможность маршрутизации трафика между провайдерами, фейловер и эволюция набора моделей без переписывания приложений.
-
Расширенный AI Gateway: поддержка Anthropic и Google Vertex AI (GA)
- Те же политики и наблюдаемость, что были для других моделей, теперь распространяются и на Anthropic, и на Google Vertex AI.
- Поддержка:
- рантайм‑губернанса,
- безопасности,
- контент‑фильтрации,
- семантического кэша,
- токен‑лимитов,
- логирования, трейсинга и метрик.
-
Расширенная наблюдаемость по токенам для AI‑нагрузок (GA)
- Метрики по всем типам токенов, не только prompt и completion.
- Поддержка cached, reasoning и thinking‑токенов.
- Выгрузка метрик в Application Insights для дашбордов стоимости и мониторинга бюджета.
-
Энтерпрайз‑улучшения платформы (GA)
- Premium v2: поддержка нескольких кастомных доменов для API, девпортала и management‑эндпоинтов с разными брендами.
- Premium v2 и Standard v2: поддержка wildcard‑хостнеймов, упрощающее управление сертификатами и DNS для большого числа API.
- Расширение workspaces на встроенный gateway:
- командная модель управления API,
- делегированное управление по командам/подразделениям,
- при этом сохраняются multi‑region деплой, кастомные хостнеймы и Private Link.
Как это работает
Централизованный каталог для API, агентов и MCP
Azure API Center превращается в единый реестр цифровых активов:
- Регистрация агентов: разработчик описывает агента (способности, входы/выходы, ограничения) и регистрирует его так же, как REST‑ или GraphQL‑API. Агент появляется в общем каталоге рядом с API и MCP‑инструментами.
- Git‑синхронизация: описания агентов и API хранятся в репозитории. API Center подтягивает их автоматически, чтобы каталог всегда совпадал с кодовой базой. Это устраняет рассинхрон между документацией и реализацией.
- LLM-as-a-Judge: перед публикацией агент прогоняется через LLM‑оценку. Модель проверяет сценарии безопасности, предсказуемость поведения и полноту ответов. Результат — автоматический скоринг и отчеты, которые можно использовать как gate в CI/CD.
MCP‑сервер Azure API Center для data plane
Azure API Center поднимает MCP‑сервер, который выступает единым discovery‑эндпоинтом:
- Агент или инструмент подключается к одному MCP‑серверу Azure.
- Через него он видит все зарегистрированные:
- MCP‑серверы,
- MCP‑инструменты,
- API,
- агентов,
- AI‑сервисы.
- Новые MCP‑инструменты, добавленные в API Center, автоматически становятся доступны всем клиентам, подключенным к этому MCP‑серверу — без их перенастройки.
Agent-to-Agent API и безопасность
Azure API Management добавляет поддержку JSON‑RPC‑ориентированных A2A‑API:
- Взаимодействие агентов переводится в формальные JSON‑RPC‑эндпоинты.
- Эти эндпоинты попадают под те же политики, что и REST/GraphQL/MCP/API моделей:
- аутентификация и авторизация,
- rate limiting,
- логирование и трейсинг,
- контент‑безопасность.
- Контент‑фильтрация теперь применяется не только к запросам к модели, но и к:
- payload MCP‑инструментов,
- сообщениям между агентами.
Unified Model API
Unified Model API работает как прослойка в Azure API Management:
- Клиент общается с единым API‑форматом (единая схема запроса/ответа, единые SDK).
- Внутри Azure API Management настраиваются маршруты и трансформации под конкретных провайдеров:
- Microsoft‑модели,
- GPT‑линейка от OpenAI,
- Claude‑линейка от Anthropic,
- модели в Google Vertex AI,
- другие совместимые провайдеры.
- Платформа:
- маппит поля между разными форматами запросов,
- управляет ключами и эндпоинтами провайдеров,
- может динамически переключать провайдера по правилам (стоимость, задержка, регион, отказ).
Для клиента всё выглядит как работа с одной моделью, хотя под капотом может работать несколько разных.
AI Gateway для Anthropic и Vertex AI
AI Gateway в Azure API Management уже умел проксировать запросы к моделям разных вендоров. Теперь он:
- понимает эндпоинты Anthropic и Google Vertex AI,
- применяет к ним те же политики, что и к другим моделям:
- проверка токенов и лимитов,
- семантический кэш (повторные похожие запросы можно обслуживать быстрее и дешевле),
- централизованный лог и трейс,
- контент‑безопасность.
Токены: cached, reasoning, thinking
Модели вводят новые типы токенов, и Azure API Management учитывает их в метриках:
- cached tokens — когда провайдер использует кэш префикса или семантический кэш;
- reasoning tokens — токены, потраченные на внутренние рассуждения модели;
- thinking tokens — расширенные режимы размышлений (названия зависят от провайдера, но Azure собирает их как отдельные категории).
Все эти метрики уходят в Application Insights, где можно:
- строить дашборды по стоимости и потреблению,
- отслеживать аномалии (резкий рост reasoning‑токенов),
- привязывать бюджеты к конкретным приложениям и командам.
Улучшения платформы для энтерпрайза
- Несколько кастомных доменов (Premium v2): один кластер Azure API Management может одновременно обслуживать, например,
api.brand1.com,api.brand2.comи отдельный домен для девпортала, при этом управляется из одной точки. - Wildcard‑хостнеймы (Premium v2, Standard v2): можно повесить один сертификат на
*.api.company.comи динамически добавлять новые поддомены для микросервисов без ручного управления каждым сертификатом. - Workspaces для встроенного gateway: командная модель управления API теперь работает и на встроенном шлюзе, а не только на self-hosted вариантах. Это позволяет:
- делегировать управление API конкретным командам,
- при этом использовать преимущества встроенного gateway: multi‑region, кастомные хостнеймы, Private Link.
Что это значит для вас
Если вы строите AI‑продукт
- Мультимодельная стратегия без боли: Unified Model API позволяет комбинировать GPT‑линейку, Claude, Vertex AI и модели Microsoft без переписывания клиента. Можно:
- тестировать нескольких провайдеров параллельно,
- держать fallback на случай недоступности одного из них,
- переключаться между моделями по цене или задержке.
- Управление агентами как API: агенты становятся полноценными объектами платформы. Вы можете:
- хранить их описания в Git,
- публиковать только те версии, которые прошли LLM‑оценку,
- давать к ним доступ другим командам через единый каталог.
- Безопасность и комплаенс: A2A‑API под управлением Azure API Management сокращают «серые зоны», где агенты общаются напрямую без логов и политик. Это критично для финансовых, медицинских и любых регулируемых сценариев.
Если вы отвечаете за платформу или архитектуру
-
Единая точка governance для:
- REST/GraphQL‑API,
- MCP‑инструментов,
- AI‑моделей,
- агентов и их взаимодействий.
Не нужно плодить отдельные платформы под каждого нового вида «актива».
-
Проще управлять мульти‑брендом и мульти‑командой:
- несколько доменов в Premium v2 позволяют разделить бренды, но держать общую политику безопасности;
- workspaces дают командам автономию, но сохраняют централизованный контроль.
-
Прозрачная стоимость AI:
- детальные токен‑метрики по всем типам токенов позволяют строить честные chargeback/showback‑модели;
- можно быстро увидеть, какой продукт «сжигает» reasoning‑токены, и оптимизировать промпты или выбор моделей.
Если вы разработчик
- Меньше SDK и форматов: вы работаете с одним API, а платформа разговаривает с разными провайдерами.
- Единый способ подключения к MCP‑инструментам: достаточно одного MCP‑коннекта к Azure API Center, чтобы получить доступ к большому числу внутренних инструментов и API.
- Понятный цикл разработки агентов:
- описали агента в репозитории,
- прогнали через автоматическую оценку,
- опубликовали в API Center,
- подключили к нему другие агенты и приложения через стандартные A2A‑API.
Где это не сработает
- Если вы делаете маленький pet‑project на одной публичной модели, без требований к комплаенсу и учету стоимости, весь этот стек будет избыточен.
- Если у вас нет доступа к Azure или ваша организация не может использовать облако Microsoft по юридическим причинам, эти обновления вам недоступны.
- Для пользователей из России: доступ к Azure и связанным сервисам может быть ограничен. В большинстве случаев потребуется корпоративный контракт и/или VPN, а также юрлицо вне РФ. Нужно проверять актуальные условия Microsoft для вашей юрисдикции.
Место на рынке
Azure API Management и Azure API Center занимают нишу governance‑платформы для API и AI‑активов. В контексте конкурентов:
- По функциональности это ближе всего к связке «API‑шлюз + AI‑прокси + каталог сервисов» у других облаков.
- Microsoft делает ставку на:
- поддержку нескольких AI‑провайдеров в одном AI Gateway (включая Anthropic и Google Vertex AI),
- Unified Model API как единый слой абстракции над моделями разных вендоров,
- глубокую интеграцию с MCP‑экосистемой и агентными сценариями (MCP‑сервер, регистрация агентов, A2A‑API).
Прямых числовых сравнений по скорости, стоимости запросов или лимитам контекста с конкурентами Microsoft не приводит. Здесь фокус не на перформансе моделей, а на управляемости, наблюдаемости и архитектуре мультимодельных и агентных систем.
Если вам важны именно эти аспекты — единый слой управления для API, моделей, агентов и MCP‑инструментов — обновления Azure API Management и Azure API Center закрывают большую часть таких задач из коробки.