- Дата публикации
Google Gemma 4 приехала в Microsoft Azure Foundry: мультимодальная open‑source ИИ-линейка с длинным контекстом
Что нового
Google DeepMind выкатил семейство Gemma 4, а Microsoft добавила его в Foundry — витрину моделей в Azure, интегрированную с Hugging Face. Теперь Gemma 4 можно официально запускать прямо внутри Azure-инфраструктуры.
Ключевые факты по Gemma 4:
- Дата релиза: 2 апреля 2026 года.
- Происхождение: общая исследовательская база с Gemini 3, но в формате открытых весов.
- Лицензия: Apache 2.0 — можно использовать в проде, дообучать, встраивать в продукты.
- Мультимодальность:
- текст + изображения + видео на всех размерах;
- анализ видео по последовательности кадров;
- аудио-вход на edge‑вариантах (E2B, E4B).
- Языки:
- предобучение на 140+ языках;
- из коробки поддержка 35+ языков для продакшен‑сценариев.
- Длинный контекст:
- до 128 000 токенов у моделей E2B/E4B;
- до 256 000 токенов у Gemma 4 26B A4B и 31B.
- Фокус на reasoning и коде:
- многошаговое планирование;
- улучшенная логика и математика;
- лучшее следование инструкциям и работа с агентами.
Что нового в Microsoft Foundry:
- В Foundry уже были модели от OpenAI, Anthropic и тысячи open‑source‑вариантов. Теперь туда добавили всю линейку Gemma 4 через коллекцию Hugging Face.
- В одном интерфейсе доступно 11 000+ моделей.
- Все развертывания Gemma 4 работают внутри вашего Azure‑тенанта с теми же политиками сети, идентификации и аудита, что и остальные сервисы.
- Есть несколько вариантов запуска:
- управляемые online‑endpoint’ы в Foundry (автоскейлинг, мониторинг);
- serverless‑деплой через Azure Container Apps для контейнеризованных приложений;
- Foundry Local — запуск оптимизированных моделей Hugging Face на своём железе.
Как это работает
Архитектура и лицензия Gemma 4
Gemma 4 — это семейство больших языковых и мультимодальных моделей, которые Google DeepMind построил на исследовательской базе Gemini 3. Разница в том, что Gemma 4 поставляется как open weights под Apache 2.0. То есть вы можете:
- скачивать веса;
- запускать локально или в облаке;
- дообучать на своих данных;
- встраивать в коммерческие продукты без сложных лицензионных ограничений.
Линейка включает несколько размеров, в том числе edge‑варианты E2B и E4B. Они оптимизированы под запуск ближе к пользователю: на собственных серверах, в локальных кластерах или на периферийных устройствах. Эти модели поддерживают аудио-вход, что удобно для голосовых интерфейсов и аналитики звонков.
Мультимодальность реализована нативно: модель принимает текст, изображения и видео. Для видео Gemma 4 обрабатывает последовательности кадров, а не один кадр, поэтому можно анализировать динамику сюжета, изменения интерфейса, жесты и т.п.
Интеграция с Microsoft Foundry и Hugging Face
Microsoft Foundry — это слой над Azure, который даёт единый control plane для работы с ИИ:
- каталог моделей (включая Gemma 4) через коллекцию Hugging Face;
- унифицированные API и SDK для разных вендоров;
- общие политики безопасности и аудита.
Как Gemma 4 попадает в ваш проект:
- Каталог моделей Foundry подтягивает коллекцию Hugging Face, где лежат веса Gemma 4.
- Вы выбираете нужный вариант (по размеру, мультимодальности, edge/облако).
- Foundry разворачивает модель как управляемый endpoint в вашем Azure‑подписке.
- Вы обращаетесь к ней через REST/SDK, как к обычному облачному сервису.
Для моделей Hugging Face с лицензиями, которые требуют явного согласия, Foundry использует Hugging Face user tokens. То есть вы один раз принимаете условия в аккаунте HF, передаёте токен, и дальше доступ к таким моделям в Azure остаётся юридически корректным, без ручной бюрократии.
Foundry Local и serverless‑подход
Если вы хотите запускать Gemma 4 на своём железе, Microsoft предлагает Foundry Local:
- тот же каталог моделей и те же паттерны SDK, что в облаке;
- оптимизированные контейнеры Hugging Face с Gemma 4;
- запуск на локальных GPU/CPU без выхода данных в публичное облако.
Документация:
- Foundry Local: https://aka.ms/foundrylocal
- Hugging Face + Foundry Local: https://aka.ms/HF/foundrylocal
Для облака есть ещё один вариант — Azure Container Apps:
- serverless‑деплой контейнеров с Gemma 4;
- автоматическое масштабирование по нагрузке;
- вы платите за фактическое использование, а не за постоянно включённый кластер.
Безопасность и Responsible AI
Microsoft завязала Gemma 4 в Foundry на свои принципы Responsible AI:
- справедливость;
- надёжность и безопасность;
- приватность и защита данных;
- инклюзивность;
- прозрачность;
- подотчётность.
В Foundry есть:
- governance‑контроллинг — кто и к каким моделям обращается;
- мониторинг качества и поведения моделей;
- инструменты оценки перед продакшеном.
Это важно, если вы запускаете Gemma 4 в банке, телеком‑компании или госструктуре, где регулятор смотрит на то, как вы обращаетесь с ИИ.
Что это значит для вас
Для кого полезна Gemma 4 в Foundry
1. Команды, которые делают продукты на Azure
Если у вас уже есть инфраструктура в Azure, Gemma 4 — это способ добавить сильную мультимодальную модель без миграции в другое облако и без развёртывания своего кластера с нуля.
Подходит для:
- чат‑ботов и ассистентов для сотрудников;
- генерации и анализа контента;
- внутренних инструментов для разработчиков.
2. Разработчики, которым нужны открытые веса
Gemma 4 под Apache 2.0 — хороший вариант, если вы:
- хотите дообучать модель на своём закрытом датасете;
- планируете кастомную донастройку под отрасль (медицина, юриспруденция, финансы);
- не хотите зависеть от одного проприетарного API.
В отличие от чисто API‑моделей, тут вы можете контролировать веса, переносить их, запускать локально и в разных облаках.
3. Команды, работающие с мультимодальностью и длинным контекстом
Gemma 4 даёт:
- текст + изображения + видео + (на edge‑моделях) аудио;
- до 128K–256K токенов контекста.
Это удобно, если вы:
- анализируете длинные юридические документы или регламенты;
- строите ассистента по большому коду;
- делаете поиск и ответы по многолетней истории переписок;
- разбираете сложные PDF с таблицами, графиками, сканами.
Конкретные сценарии
Документ‑интеллект
Gemma 4 умеет обрабатывать:
- PDF;
- сканы;
- графики и диаграммы;
- счета и накладные;
- сложные таблицы.
За счёт встроенного vision‑модуля можно:
- вытаскивать структурированные данные из документов;
- строить сводки по пачке файлов;
- искать конкретные условия в договорах.
Мультиязычные корпоративные приложения
Модель предобучили на 140+ языках, а для продакшена оптимизировали 35+ языков. Это подходит для:
- мультиязычной поддержки клиентов;
- платформ с пользовательским контентом (отзывы, посты, комментарии);
- языковых тренажёров для практики письма и грамматики.
Длинный контекст и аналитика
С окном до 256K токенов вы можете:
- загружать целые репозитории кода и спрашивать про архитектуру и баги;
- анализировать длинные юридические кейсы без жёсткого разбиения на куски;
- хранить историю многосессионного диалога с пользователем и опираться на неё.
Агентные сценарии и код
Gemma 4 заточена под:
- многошаговое планирование;
- сложную логику и математику;
- следование инструкциям для автономных агентов.
Сюда хорошо ложатся:
- ассистенты‑разработчики, которые читают код, пишут патчи, готовят pull‑request’ы;
- бизнес‑агенты, которые ходят по API, собирают данные и принимают решения по правилам.
Где Gemma 4 не подойдёт
- Если вы живёте строго в экосистеме другого облака и не хотите Azure — интеграция через Foundry для вас лишний слой.
- Если у вас совсем маленький проект без требований к мультимодальности и длинному контексту, вам может хватить более простой и дешёвой модели.
- Если вам нужен строго on‑prem без Azure и без Foundry Local, придётся самостоятельно поднимать Gemma 4 из репозитория Hugging Face или от Google DeepMind.
Доступность из России
Gemma 4 официально доступна через Microsoft Azure Foundry и Hugging Face.
- Доступ к Azure и Hugging Face из России может быть ограничен из‑за санкций и политик вендоров.
- Часто для работы с такими сервисами используют VPN и зарубежные аккаунты, но это зона вашей ответственности — и юридической, и технической.
Если вы работаете в российской компании, заранее проверьте:
- можно ли вашей организации пользоваться Azure;
- какие есть внутренние политики по использованию зарубежных облаков.
Место на рынке
Microsoft позиционирует Foundry как площадку, где под одной панелью управления доступны:
- Gemma 4;
- модели OpenAI (например, GPT‑линейка);
- модели Anthropic (например, Claude‑линейка);
- 11 000+ моделей из экосистемы Hugging Face.
Фактически это значит:
- вы можете сравнивать Gemma 4 с GPT и Claude в одном окружении;
- переключаться между open‑source и проприетарными моделями без смены инфраструктуры;
- строить гибридные пайплайны: где‑то использовать Gemma 4 с открытыми весами, где‑то — проприетарные модели.
Прямых цифр по скорости, стоимости токена или качеству относительно GPT‑4/5 и Claude 3/4 в анонсе нет. Но по позиционированию Gemma 4 — это frontier‑уровень open‑source‑линейки, которая должна конкурировать с крупными проприетарными моделями по качеству, при этом оставаясь открытой по лицензии.
Если вы строите стек вокруг Azure и хотите опираться на открытые веса, Gemma 4 в Foundry сейчас один из самых логичных вариантов: мультимодальность, длинный контекст, много языков и нормальная лицензия Apache 2.0.
Как начать
- Откройте Microsoft Foundry в своей Azure‑подписке.
- Найдите коллекцию Hugging Face и выберите Gemma 4 нужного размера.
- Разверните модель как online endpoint или через Azure Container Apps.
- Для локального запуска изучите Foundry Local:
- https://aka.ms/foundrylocal
- https://aka.ms/HF/foundrylocal
Новые модели из Hugging Face будут регулярно появляться в Foundry по мере обновления коллекции. Если вам нужна конкретная модель, Microsoft предлагает отправить запрос через форму обратной связи и следить за анонсами в сообществе разработчиков (Discord и серия Model Mondays).