Дата публикации
ai_products

Google Gemma 4 приехала в Microsoft Azure Foundry: мультимодальная open‑source ИИ-линейка с длинным контекстом

Что нового

Google DeepMind выкатил семейство Gemma 4, а Microsoft добавила его в Foundry — витрину моделей в Azure, интегрированную с Hugging Face. Теперь Gemma 4 можно официально запускать прямо внутри Azure-инфраструктуры.

Ключевые факты по Gemma 4:

  • Дата релиза: 2 апреля 2026 года.
  • Происхождение: общая исследовательская база с Gemini 3, но в формате открытых весов.
  • Лицензия: Apache 2.0 — можно использовать в проде, дообучать, встраивать в продукты.
  • Мультимодальность:
    • текст + изображения + видео на всех размерах;
    • анализ видео по последовательности кадров;
    • аудио-вход на edge‑вариантах (E2B, E4B).
  • Языки:
    • предобучение на 140+ языках;
    • из коробки поддержка 35+ языков для продакшен‑сценариев.
  • Длинный контекст:
    • до 128 000 токенов у моделей E2B/E4B;
    • до 256 000 токенов у Gemma 4 26B A4B и 31B.
  • Фокус на reasoning и коде:
    • многошаговое планирование;
    • улучшенная логика и математика;
    • лучшее следование инструкциям и работа с агентами.

Что нового в Microsoft Foundry:

  • В Foundry уже были модели от OpenAI, Anthropic и тысячи open‑source‑вариантов. Теперь туда добавили всю линейку Gemma 4 через коллекцию Hugging Face.
  • В одном интерфейсе доступно 11 000+ моделей.
  • Все развертывания Gemma 4 работают внутри вашего Azure‑тенанта с теми же политиками сети, идентификации и аудита, что и остальные сервисы.
  • Есть несколько вариантов запуска:
    • управляемые online‑endpoint’ы в Foundry (автоскейлинг, мониторинг);
    • serverless‑деплой через Azure Container Apps для контейнеризованных приложений;
    • Foundry Local — запуск оптимизированных моделей Hugging Face на своём железе.

Как это работает

Архитектура и лицензия Gemma 4

Gemma 4 — это семейство больших языковых и мультимодальных моделей, которые Google DeepMind построил на исследовательской базе Gemini 3. Разница в том, что Gemma 4 поставляется как open weights под Apache 2.0. То есть вы можете:

  • скачивать веса;
  • запускать локально или в облаке;
  • дообучать на своих данных;
  • встраивать в коммерческие продукты без сложных лицензионных ограничений.

Линейка включает несколько размеров, в том числе edge‑варианты E2B и E4B. Они оптимизированы под запуск ближе к пользователю: на собственных серверах, в локальных кластерах или на периферийных устройствах. Эти модели поддерживают аудио-вход, что удобно для голосовых интерфейсов и аналитики звонков.

Мультимодальность реализована нативно: модель принимает текст, изображения и видео. Для видео Gemma 4 обрабатывает последовательности кадров, а не один кадр, поэтому можно анализировать динамику сюжета, изменения интерфейса, жесты и т.п.

Интеграция с Microsoft Foundry и Hugging Face

Microsoft Foundry — это слой над Azure, который даёт единый control plane для работы с ИИ:

  • каталог моделей (включая Gemma 4) через коллекцию Hugging Face;
  • унифицированные API и SDK для разных вендоров;
  • общие политики безопасности и аудита.

Как Gemma 4 попадает в ваш проект:

  1. Каталог моделей Foundry подтягивает коллекцию Hugging Face, где лежат веса Gemma 4.
  2. Вы выбираете нужный вариант (по размеру, мультимодальности, edge/облако).
  3. Foundry разворачивает модель как управляемый endpoint в вашем Azure‑подписке.
  4. Вы обращаетесь к ней через REST/SDK, как к обычному облачному сервису.

Для моделей Hugging Face с лицензиями, которые требуют явного согласия, Foundry использует Hugging Face user tokens. То есть вы один раз принимаете условия в аккаунте HF, передаёте токен, и дальше доступ к таким моделям в Azure остаётся юридически корректным, без ручной бюрократии.

Foundry Local и serverless‑подход

Если вы хотите запускать Gemma 4 на своём железе, Microsoft предлагает Foundry Local:

  • тот же каталог моделей и те же паттерны SDK, что в облаке;
  • оптимизированные контейнеры Hugging Face с Gemma 4;
  • запуск на локальных GPU/CPU без выхода данных в публичное облако.

Документация:

  • Foundry Local: https://aka.ms/foundrylocal
  • Hugging Face + Foundry Local: https://aka.ms/HF/foundrylocal

Для облака есть ещё один вариант — Azure Container Apps:

  • serverless‑деплой контейнеров с Gemma 4;
  • автоматическое масштабирование по нагрузке;
  • вы платите за фактическое использование, а не за постоянно включённый кластер.

Безопасность и Responsible AI

Microsoft завязала Gemma 4 в Foundry на свои принципы Responsible AI:

  • справедливость;
  • надёжность и безопасность;
  • приватность и защита данных;
  • инклюзивность;
  • прозрачность;
  • подотчётность.

В Foundry есть:

  • governance‑контроллинг — кто и к каким моделям обращается;
  • мониторинг качества и поведения моделей;
  • инструменты оценки перед продакшеном.

Это важно, если вы запускаете Gemma 4 в банке, телеком‑компании или госструктуре, где регулятор смотрит на то, как вы обращаетесь с ИИ.

Что это значит для вас

Для кого полезна Gemma 4 в Foundry

1. Команды, которые делают продукты на Azure

Если у вас уже есть инфраструктура в Azure, Gemma 4 — это способ добавить сильную мультимодальную модель без миграции в другое облако и без развёртывания своего кластера с нуля.

Подходит для:

  • чат‑ботов и ассистентов для сотрудников;
  • генерации и анализа контента;
  • внутренних инструментов для разработчиков.

2. Разработчики, которым нужны открытые веса

Gemma 4 под Apache 2.0 — хороший вариант, если вы:

  • хотите дообучать модель на своём закрытом датасете;
  • планируете кастомную донастройку под отрасль (медицина, юриспруденция, финансы);
  • не хотите зависеть от одного проприетарного API.

В отличие от чисто API‑моделей, тут вы можете контролировать веса, переносить их, запускать локально и в разных облаках.

3. Команды, работающие с мультимодальностью и длинным контекстом

Gemma 4 даёт:

  • текст + изображения + видео + (на edge‑моделях) аудио;
  • до 128K–256K токенов контекста.

Это удобно, если вы:

  • анализируете длинные юридические документы или регламенты;
  • строите ассистента по большому коду;
  • делаете поиск и ответы по многолетней истории переписок;
  • разбираете сложные PDF с таблицами, графиками, сканами.

Конкретные сценарии

Документ‑интеллект

Gemma 4 умеет обрабатывать:

  • PDF;
  • сканы;
  • графики и диаграммы;
  • счета и накладные;
  • сложные таблицы.

За счёт встроенного vision‑модуля можно:

  • вытаскивать структурированные данные из документов;
  • строить сводки по пачке файлов;
  • искать конкретные условия в договорах.

Мультиязычные корпоративные приложения

Модель предобучили на 140+ языках, а для продакшена оптимизировали 35+ языков. Это подходит для:

  • мультиязычной поддержки клиентов;
  • платформ с пользовательским контентом (отзывы, посты, комментарии);
  • языковых тренажёров для практики письма и грамматики.

Длинный контекст и аналитика

С окном до 256K токенов вы можете:

  • загружать целые репозитории кода и спрашивать про архитектуру и баги;
  • анализировать длинные юридические кейсы без жёсткого разбиения на куски;
  • хранить историю многосессионного диалога с пользователем и опираться на неё.

Агентные сценарии и код

Gemma 4 заточена под:

  • многошаговое планирование;
  • сложную логику и математику;
  • следование инструкциям для автономных агентов.

Сюда хорошо ложатся:

  • ассистенты‑разработчики, которые читают код, пишут патчи, готовят pull‑request’ы;
  • бизнес‑агенты, которые ходят по API, собирают данные и принимают решения по правилам.

Где Gemma 4 не подойдёт

  • Если вы живёте строго в экосистеме другого облака и не хотите Azure — интеграция через Foundry для вас лишний слой.
  • Если у вас совсем маленький проект без требований к мультимодальности и длинному контексту, вам может хватить более простой и дешёвой модели.
  • Если вам нужен строго on‑prem без Azure и без Foundry Local, придётся самостоятельно поднимать Gemma 4 из репозитория Hugging Face или от Google DeepMind.

Доступность из России

Gemma 4 официально доступна через Microsoft Azure Foundry и Hugging Face.

  • Доступ к Azure и Hugging Face из России может быть ограничен из‑за санкций и политик вендоров.
  • Часто для работы с такими сервисами используют VPN и зарубежные аккаунты, но это зона вашей ответственности — и юридической, и технической.

Если вы работаете в российской компании, заранее проверьте:

  • можно ли вашей организации пользоваться Azure;
  • какие есть внутренние политики по использованию зарубежных облаков.

Место на рынке

Microsoft позиционирует Foundry как площадку, где под одной панелью управления доступны:

  • Gemma 4;
  • модели OpenAI (например, GPT‑линейка);
  • модели Anthropic (например, Claude‑линейка);
  • 11 000+ моделей из экосистемы Hugging Face.

Фактически это значит:

  • вы можете сравнивать Gemma 4 с GPT и Claude в одном окружении;
  • переключаться между open‑source и проприетарными моделями без смены инфраструктуры;
  • строить гибридные пайплайны: где‑то использовать Gemma 4 с открытыми весами, где‑то — проприетарные модели.

Прямых цифр по скорости, стоимости токена или качеству относительно GPT‑4/5 и Claude 3/4 в анонсе нет. Но по позиционированию Gemma 4 — это frontier‑уровень open‑source‑линейки, которая должна конкурировать с крупными проприетарными моделями по качеству, при этом оставаясь открытой по лицензии.

Если вы строите стек вокруг Azure и хотите опираться на открытые веса, Gemma 4 в Foundry сейчас один из самых логичных вариантов: мультимодальность, длинный контекст, много языков и нормальная лицензия Apache 2.0.

Как начать

  • Откройте Microsoft Foundry в своей Azure‑подписке.
  • Найдите коллекцию Hugging Face и выберите Gemma 4 нужного размера.
  • Разверните модель как online endpoint или через Azure Container Apps.
  • Для локального запуска изучите Foundry Local:
    • https://aka.ms/foundrylocal
    • https://aka.ms/HF/foundrylocal

Новые модели из Hugging Face будут регулярно появляться в Foundry по мере обновления коллекции. Если вам нужна конкретная модель, Microsoft предлагает отправить запрос через форму обратной связи и следить за анонсами в сообществе разработчиков (Discord и серия Model Mondays).


Читайте также

Google Gemma 4 приехала в Microsoft Azure Foundry: мультимодальная open‑source ИИ-линейка с длинным контекстом — VogueTech | VogueTech