Google Gemma 4 приехала в Microsoft Azure Foundry: мультимодальная open‑source ИИ-линейка с длинным контекстом — VogueTech

Что нового

Google DeepMind выкатил семейство Gemma 4, а Microsoft добавила его в Foundry — витрину моделей в Azure, интегрированную с Hugging Face. Теперь Gemma 4 можно официально запускать прямо внутри Azure-инфраструктуры.

Ключевые факты по Gemma 4:

Дата релиза: 2 апреля 2026 года.
Происхождение: общая исследовательская база с Gemini 3, но в формате открытых весов.
Лицензия: Apache 2.0 — можно использовать в проде, дообучать, встраивать в продукты.
Мультимодальность:
- текст + изображения + видео на всех размерах;
- анализ видео по последовательности кадров;
- аудио-вход на edge‑вариантах (E2B, E4B).
Языки:
- предобучение на 140+ языках;
- из коробки поддержка 35+ языков для продакшен‑сценариев.
Длинный контекст:
- до 128 000 токенов у моделей E2B/E4B;
- до 256 000 токенов у Gemma 4 26B A4B и 31B.
Фокус на reasoning и коде:
- многошаговое планирование;
- улучшенная логика и математика;
- лучшее следование инструкциям и работа с агентами.

Что нового в Microsoft Foundry:

В Foundry уже были модели от OpenAI, Anthropic и тысячи open‑source‑вариантов. Теперь туда добавили всю линейку Gemma 4 через коллекцию Hugging Face.
В одном интерфейсе доступно 11 000+ моделей.
Все развертывания Gemma 4 работают внутри вашего Azure‑тенанта с теми же политиками сети, идентификации и аудита, что и остальные сервисы.
Есть несколько вариантов запуска:
- управляемые online‑endpoint’ы в Foundry (автоскейлинг, мониторинг);
- serverless‑деплой через Azure Container Apps для контейнеризованных приложений;
- Foundry Local — запуск оптимизированных моделей Hugging Face на своём железе.

Как это работает

Архитектура и лицензия Gemma 4

Gemma 4 — это семейство больших языковых и мультимодальных моделей, которые Google DeepMind построил на исследовательской базе Gemini 3. Разница в том, что Gemma 4 поставляется как open weights под Apache 2.0. То есть вы можете:

скачивать веса;
запускать локально или в облаке;
дообучать на своих данных;
встраивать в коммерческие продукты без сложных лицензионных ограничений.

Линейка включает несколько размеров, в том числе edge‑варианты E2B и E4B. Они оптимизированы под запуск ближе к пользователю: на собственных серверах, в локальных кластерах или на периферийных устройствах. Эти модели поддерживают аудио-вход, что удобно для голосовых интерфейсов и аналитики звонков.

Мультимодальность реализована нативно: модель принимает текст, изображения и видео. Для видео Gemma 4 обрабатывает последовательности кадров, а не один кадр, поэтому можно анализировать динамику сюжета, изменения интерфейса, жесты и т.п.

Интеграция с Microsoft Foundry и Hugging Face

Microsoft Foundry — это слой над Azure, который даёт единый control plane для работы с ИИ:

каталог моделей (включая Gemma 4) через коллекцию Hugging Face;
унифицированные API и SDK для разных вендоров;
общие политики безопасности и аудита.

Как Gemma 4 попадает в ваш проект:

Каталог моделей Foundry подтягивает коллекцию Hugging Face, где лежат веса Gemma 4.
Вы выбираете нужный вариант (по размеру, мультимодальности, edge/облако).
Foundry разворачивает модель как управляемый endpoint в вашем Azure‑подписке.
Вы обращаетесь к ней через REST/SDK, как к обычному облачному сервису.

Для моделей Hugging Face с лицензиями, которые требуют явного согласия, Foundry использует Hugging Face user tokens. То есть вы один раз принимаете условия в аккаунте HF, передаёте токен, и дальше доступ к таким моделям в Azure остаётся юридически корректным, без ручной бюрократии.

Foundry Local и serverless‑подход

Если вы хотите запускать Gemma 4 на своём железе, Microsoft предлагает Foundry Local:

тот же каталог моделей и те же паттерны SDK, что в облаке;
оптимизированные контейнеры Hugging Face с Gemma 4;
запуск на локальных GPU/CPU без выхода данных в публичное облако.

Документация:

Foundry Local: https://aka.ms/foundrylocal
Hugging Face + Foundry Local: https://aka.ms/HF/foundrylocal

Для облака есть ещё один вариант — Azure Container Apps:

serverless‑деплой контейнеров с Gemma 4;
автоматическое масштабирование по нагрузке;
вы платите за фактическое использование, а не за постоянно включённый кластер.

Безопасность и Responsible AI

Microsoft завязала Gemma 4 в Foundry на свои принципы Responsible AI:

справедливость;
надёжность и безопасность;
приватность и защита данных;
инклюзивность;
прозрачность;
подотчётность.

В Foundry есть:

governance‑контроллинг — кто и к каким моделям обращается;
мониторинг качества и поведения моделей;
инструменты оценки перед продакшеном.

Это важно, если вы запускаете Gemma 4 в банке, телеком‑компании или госструктуре, где регулятор смотрит на то, как вы обращаетесь с ИИ.

Что это значит для вас

Для кого полезна Gemma 4 в Foundry

1. Команды, которые делают продукты на Azure

Если у вас уже есть инфраструктура в Azure, Gemma 4 — это способ добавить сильную мультимодальную модель без миграции в другое облако и без развёртывания своего кластера с нуля.

Подходит для:

чат‑ботов и ассистентов для сотрудников;
генерации и анализа контента;
внутренних инструментов для разработчиков.

2. Разработчики, которым нужны открытые веса

Gemma 4 под Apache 2.0 — хороший вариант, если вы:

хотите дообучать модель на своём закрытом датасете;
планируете кастомную донастройку под отрасль (медицина, юриспруденция, финансы);
не хотите зависеть от одного проприетарного API.

В отличие от чисто API‑моделей, тут вы можете контролировать веса, переносить их, запускать локально и в разных облаках.

3. Команды, работающие с мультимодальностью и длинным контекстом

Gemma 4 даёт:

текст + изображения + видео + (на edge‑моделях) аудио;
до 128K–256K токенов контекста.

Это удобно, если вы:

анализируете длинные юридические документы или регламенты;
строите ассистента по большому коду;
делаете поиск и ответы по многолетней истории переписок;
разбираете сложные PDF с таблицами, графиками, сканами.

Конкретные сценарии

Документ‑интеллект

Gemma 4 умеет обрабатывать:

PDF;
сканы;
графики и диаграммы;
счета и накладные;
сложные таблицы.

За счёт встроенного vision‑модуля можно:

вытаскивать структурированные данные из документов;
строить сводки по пачке файлов;
искать конкретные условия в договорах.

Мультиязычные корпоративные приложения

Модель предобучили на 140+ языках, а для продакшена оптимизировали 35+ языков. Это подходит для:

мультиязычной поддержки клиентов;
платформ с пользовательским контентом (отзывы, посты, комментарии);
языковых тренажёров для практики письма и грамматики.

Длинный контекст и аналитика

С окном до 256K токенов вы можете:

загружать целые репозитории кода и спрашивать про архитектуру и баги;
анализировать длинные юридические кейсы без жёсткого разбиения на куски;
хранить историю многосессионного диалога с пользователем и опираться на неё.

Агентные сценарии и код

Gemma 4 заточена под:

многошаговое планирование;
сложную логику и математику;
следование инструкциям для автономных агентов.

Сюда хорошо ложатся:

ассистенты‑разработчики, которые читают код, пишут патчи, готовят pull‑request’ы;
бизнес‑агенты, которые ходят по API, собирают данные и принимают решения по правилам.

Где Gemma 4 не подойдёт

Если вы живёте строго в экосистеме другого облака и не хотите Azure — интеграция через Foundry для вас лишний слой.
Если у вас совсем маленький проект без требований к мультимодальности и длинному контексту, вам может хватить более простой и дешёвой модели.
Если вам нужен строго on‑prem без Azure и без Foundry Local, придётся самостоятельно поднимать Gemma 4 из репозитория Hugging Face или от Google DeepMind.

Доступность из России

Gemma 4 официально доступна через Microsoft Azure Foundry и Hugging Face.

Доступ к Azure и Hugging Face из России может быть ограничен из‑за санкций и политик вендоров.
Часто для работы с такими сервисами используют VPN и зарубежные аккаунты, но это зона вашей ответственности — и юридической, и технической.

Если вы работаете в российской компании, заранее проверьте:

можно ли вашей организации пользоваться Azure;
какие есть внутренние политики по использованию зарубежных облаков.

Место на рынке

Microsoft позиционирует Foundry как площадку, где под одной панелью управления доступны:

Gemma 4;
модели OpenAI (например, GPT‑линейка);
модели Anthropic (например, Claude‑линейка);
11 000+ моделей из экосистемы Hugging Face.

Фактически это значит:

вы можете сравнивать Gemma 4 с GPT и Claude в одном окружении;
переключаться между open‑source и проприетарными моделями без смены инфраструктуры;
строить гибридные пайплайны: где‑то использовать Gemma 4 с открытыми весами, где‑то — проприетарные модели.

Прямых цифр по скорости, стоимости токена или качеству относительно GPT‑4/5 и Claude 3/4 в анонсе нет. Но по позиционированию Gemma 4 — это frontier‑уровень open‑source‑линейки, которая должна конкурировать с крупными проприетарными моделями по качеству, при этом оставаясь открытой по лицензии.

Если вы строите стек вокруг Azure и хотите опираться на открытые веса, Gemma 4 в Foundry сейчас один из самых логичных вариантов: мультимодальность, длинный контекст, много языков и нормальная лицензия Apache 2.0.

Как начать

Откройте Microsoft Foundry в своей Azure‑подписке.
Найдите коллекцию Hugging Face и выберите Gemma 4 нужного размера.
Разверните модель как online endpoint или через Azure Container Apps.
Для локального запуска изучите Foundry Local:
- https://aka.ms/foundrylocal
- https://aka.ms/HF/foundrylocal

Новые модели из Hugging Face будут регулярно появляться в Foundry по мере обновления коллекции. Если вам нужна конкретная модель, Microsoft предлагает отправить запрос через форму обратной связи и следить за анонсами в сообществе разработчиков (Discord и серия Model Mondays).