Дата публикации
ai_products

Microsoft расширяет Azure API Management: единый вход для API, моделей, агентов и MCP-инструментов

Что нового

Microsoft на Build 2026 сильно перетрясла Azure API Management и Azure API Center под задачи AI‑продуктов и агентных систем. Главное:

  1. Azure API Center — общий каталог для API и AI‑активов (GA)

    • Регистрация не только API, но и агентов, MCP‑инструментов, промптов, скиллов и AI‑сервисов.
    • Синхронизация описаний агентов из Git‑репозиториев.
    • Автоматическая оценка агентов по схеме LLM-as-a-Judge до публикации в каталоге.
    • Общий MCP‑сервер для data plane: единая точка обнаружения MCP‑серверов, тулов, API, агентов и AI‑активов через один MCP‑коннект.
  2. Agent-to-Agent API и контент‑безопасность для агентов (GA)

    • Поддержка JSON‑RPC‑основанных Agent‑to‑Agent (A2A) API в Azure API Management.
    • Единая политика безопасности и контент‑фильтрации для:
      • вызовов моделей,
      • MCP‑инструментов,
      • взаимодействия агентов друг с другом.
  3. Unified Model API для мультимодельных AI‑приложений (Public Preview)

    • Один клиентский API поверх нескольких провайдеров моделей: Microsoft, OpenAI, Anthropic, Google и других.
    • Azure API Management берет на себя трансформацию запросов/ответов под конкретный API провайдера.
    • Возможность маршрутизации трафика между провайдерами, фейловер и эволюция набора моделей без переписывания приложений.
  4. Расширенный AI Gateway: поддержка Anthropic и Google Vertex AI (GA)

    • Те же политики и наблюдаемость, что были для других моделей, теперь распространяются и на Anthropic, и на Google Vertex AI.
    • Поддержка:
      • рантайм‑губернанса,
      • безопасности,
      • контент‑фильтрации,
      • семантического кэша,
      • токен‑лимитов,
      • логирования, трейсинга и метрик.
  5. Расширенная наблюдаемость по токенам для AI‑нагрузок (GA)

    • Метрики по всем типам токенов, не только prompt и completion.
    • Поддержка cached, reasoning и thinking‑токенов.
    • Выгрузка метрик в Application Insights для дашбордов стоимости и мониторинга бюджета.
  6. Энтерпрайз‑улучшения платформы (GA)

    • Premium v2: поддержка нескольких кастомных доменов для API, девпортала и management‑эндпоинтов с разными брендами.
    • Premium v2 и Standard v2: поддержка wildcard‑хостнеймов, упрощающее управление сертификатами и DNS для большого числа API.
    • Расширение workspaces на встроенный gateway:
      • командная модель управления API,
      • делегированное управление по командам/подразделениям,
      • при этом сохраняются multi‑region деплой, кастомные хостнеймы и Private Link.

Как это работает

Централизованный каталог для API, агентов и MCP

Azure API Center превращается в единый реестр цифровых активов:

  • Регистрация агентов: разработчик описывает агента (способности, входы/выходы, ограничения) и регистрирует его так же, как REST‑ или GraphQL‑API. Агент появляется в общем каталоге рядом с API и MCP‑инструментами.
  • Git‑синхронизация: описания агентов и API хранятся в репозитории. API Center подтягивает их автоматически, чтобы каталог всегда совпадал с кодовой базой. Это устраняет рассинхрон между документацией и реализацией.
  • LLM-as-a-Judge: перед публикацией агент прогоняется через LLM‑оценку. Модель проверяет сценарии безопасности, предсказуемость поведения и полноту ответов. Результат — автоматический скоринг и отчеты, которые можно использовать как gate в CI/CD.

MCP‑сервер Azure API Center для data plane

Azure API Center поднимает MCP‑сервер, который выступает единым discovery‑эндпоинтом:

  • Агент или инструмент подключается к одному MCP‑серверу Azure.
  • Через него он видит все зарегистрированные:
    • MCP‑серверы,
    • MCP‑инструменты,
    • API,
    • агентов,
    • AI‑сервисы.
  • Новые MCP‑инструменты, добавленные в API Center, автоматически становятся доступны всем клиентам, подключенным к этому MCP‑серверу — без их перенастройки.

Agent-to-Agent API и безопасность

Azure API Management добавляет поддержку JSON‑RPC‑ориентированных A2A‑API:

  • Взаимодействие агентов переводится в формальные JSON‑RPC‑эндпоинты.
  • Эти эндпоинты попадают под те же политики, что и REST/GraphQL/MCP/API моделей:
    • аутентификация и авторизация,
    • rate limiting,
    • логирование и трейсинг,
    • контент‑безопасность.
  • Контент‑фильтрация теперь применяется не только к запросам к модели, но и к:
    • payload MCP‑инструментов,
    • сообщениям между агентами.

Unified Model API

Unified Model API работает как прослойка в Azure API Management:

  • Клиент общается с единым API‑форматом (единая схема запроса/ответа, единые SDK).
  • Внутри Azure API Management настраиваются маршруты и трансформации под конкретных провайдеров:
    • Microsoft‑модели,
    • GPT‑линейка от OpenAI,
    • Claude‑линейка от Anthropic,
    • модели в Google Vertex AI,
    • другие совместимые провайдеры.
  • Платформа:
    • маппит поля между разными форматами запросов,
    • управляет ключами и эндпоинтами провайдеров,
    • может динамически переключать провайдера по правилам (стоимость, задержка, регион, отказ).

Для клиента всё выглядит как работа с одной моделью, хотя под капотом может работать несколько разных.

AI Gateway для Anthropic и Vertex AI

AI Gateway в Azure API Management уже умел проксировать запросы к моделям разных вендоров. Теперь он:

  • понимает эндпоинты Anthropic и Google Vertex AI,
  • применяет к ним те же политики, что и к другим моделям:
    • проверка токенов и лимитов,
    • семантический кэш (повторные похожие запросы можно обслуживать быстрее и дешевле),
    • централизованный лог и трейс,
    • контент‑безопасность.

Токены: cached, reasoning, thinking

Модели вводят новые типы токенов, и Azure API Management учитывает их в метриках:

  • cached tokens — когда провайдер использует кэш префикса или семантический кэш;
  • reasoning tokens — токены, потраченные на внутренние рассуждения модели;
  • thinking tokens — расширенные режимы размышлений (названия зависят от провайдера, но Azure собирает их как отдельные категории).

Все эти метрики уходят в Application Insights, где можно:

  • строить дашборды по стоимости и потреблению,
  • отслеживать аномалии (резкий рост reasoning‑токенов),
  • привязывать бюджеты к конкретным приложениям и командам.

Улучшения платформы для энтерпрайза

  • Несколько кастомных доменов (Premium v2): один кластер Azure API Management может одновременно обслуживать, например, api.brand1.com, api.brand2.com и отдельный домен для девпортала, при этом управляется из одной точки.
  • Wildcard‑хостнеймы (Premium v2, Standard v2): можно повесить один сертификат на *.api.company.com и динамически добавлять новые поддомены для микросервисов без ручного управления каждым сертификатом.
  • Workspaces для встроенного gateway: командная модель управления API теперь работает и на встроенном шлюзе, а не только на self-hosted вариантах. Это позволяет:
    • делегировать управление API конкретным командам,
    • при этом использовать преимущества встроенного gateway: multi‑region, кастомные хостнеймы, Private Link.

Что это значит для вас

Если вы строите AI‑продукт

  • Мультимодельная стратегия без боли: Unified Model API позволяет комбинировать GPT‑линейку, Claude, Vertex AI и модели Microsoft без переписывания клиента. Можно:
    • тестировать нескольких провайдеров параллельно,
    • держать fallback на случай недоступности одного из них,
    • переключаться между моделями по цене или задержке.
  • Управление агентами как API: агенты становятся полноценными объектами платформы. Вы можете:
    • хранить их описания в Git,
    • публиковать только те версии, которые прошли LLM‑оценку,
    • давать к ним доступ другим командам через единый каталог.
  • Безопасность и комплаенс: A2A‑API под управлением Azure API Management сокращают «серые зоны», где агенты общаются напрямую без логов и политик. Это критично для финансовых, медицинских и любых регулируемых сценариев.

Если вы отвечаете за платформу или архитектуру

  • Единая точка governance для:

    • REST/GraphQL‑API,
    • MCP‑инструментов,
    • AI‑моделей,
    • агентов и их взаимодействий.

    Не нужно плодить отдельные платформы под каждого нового вида «актива».

  • Проще управлять мульти‑брендом и мульти‑командой:

    • несколько доменов в Premium v2 позволяют разделить бренды, но держать общую политику безопасности;
    • workspaces дают командам автономию, но сохраняют централизованный контроль.
  • Прозрачная стоимость AI:

    • детальные токен‑метрики по всем типам токенов позволяют строить честные chargeback/showback‑модели;
    • можно быстро увидеть, какой продукт «сжигает» reasoning‑токены, и оптимизировать промпты или выбор моделей.

Если вы разработчик

  • Меньше SDK и форматов: вы работаете с одним API, а платформа разговаривает с разными провайдерами.
  • Единый способ подключения к MCP‑инструментам: достаточно одного MCP‑коннекта к Azure API Center, чтобы получить доступ к большому числу внутренних инструментов и API.
  • Понятный цикл разработки агентов:
    • описали агента в репозитории,
    • прогнали через автоматическую оценку,
    • опубликовали в API Center,
    • подключили к нему другие агенты и приложения через стандартные A2A‑API.

Где это не сработает

  • Если вы делаете маленький pet‑project на одной публичной модели, без требований к комплаенсу и учету стоимости, весь этот стек будет избыточен.
  • Если у вас нет доступа к Azure или ваша организация не может использовать облако Microsoft по юридическим причинам, эти обновления вам недоступны.
  • Для пользователей из России: доступ к Azure и связанным сервисам может быть ограничен. В большинстве случаев потребуется корпоративный контракт и/или VPN, а также юрлицо вне РФ. Нужно проверять актуальные условия Microsoft для вашей юрисдикции.

Место на рынке

Azure API Management и Azure API Center занимают нишу governance‑платформы для API и AI‑активов. В контексте конкурентов:

  • По функциональности это ближе всего к связке «API‑шлюз + AI‑прокси + каталог сервисов» у других облаков.
  • Microsoft делает ставку на:
    • поддержку нескольких AI‑провайдеров в одном AI Gateway (включая Anthropic и Google Vertex AI),
    • Unified Model API как единый слой абстракции над моделями разных вендоров,
    • глубокую интеграцию с MCP‑экосистемой и агентными сценариями (MCP‑сервер, регистрация агентов, A2A‑API).

Прямых числовых сравнений по скорости, стоимости запросов или лимитам контекста с конкурентами Microsoft не приводит. Здесь фокус не на перформансе моделей, а на управляемости, наблюдаемости и архитектуре мультимодельных и агентных систем.

Если вам важны именно эти аспекты — единый слой управления для API, моделей, агентов и MCP‑инструментов — обновления Azure API Management и Azure API Center закрывают большую часть таких задач из коробки.


Читайте также