- Дата публикации
Google запустила Nano Banana 2 Lite и Gemini Omni: быстрые картинки плюс видео до 10 секунд
Что нового
Google расширила линейку генеративной графики за счёт связки двух продуктов:
- Nano Banana 2 Lite — ускоренная модель для генерации изображений.
- Gemini Omni Flash — видеогенерация на базе Gemini Omni.
Главная идея: вы делаете картинку в Nano Banana 2 Lite и сразу же анимируете её в видео через Gemini Omni Flash.
Из конкретики по возможностям сейчас:
- Длина видео в Gemini Omni — до 10 секунд на один запрос.
- Поддержка видео-референсов — можно передать ролик до 3 секунд через API-схему, но модель сейчас обрабатывает их некорректно.
- Аудио-референсы и расширение сцены (scene extension) через Gemini API пока недоступны.
- Стабильность персонажей при смене ракурсов и панорамах ограничена: модель может «ломать» внешний вид героя между сценами.
- Публичный превью-доступ: Gemini Omni уже можно тестировать в Google AI Studio и через Gemini API в поддерживаемых регионах.
- Google выложила демо‑приложения, где Nano Banana 2 Lite и Gemini Omni Flash собраны в один пайплайн, и их можно ремиксить под свои задачи.
Ещё одна деталь: при использовании Interactions API можно сохранять историю сессии и контекст. Это позволяет пользователю делать до трёх последовательных правок одного видео или сцены.
Как это работает
Архитектура завязана на последовательную работу двух разных моделей Google:
-
Nano Banana 2 Lite
- Отвечает за быструю генерацию исходного изображения.
- Работает как отдельная модель в экосистеме Gemini API.
- На выходе даёт картинку, которую можно передать дальше как референс.
-
Gemini Omni Flash (часть семейства Gemini Omni)
- Принимает на вход изображение‑референс и текстовый запрос.
- Генерирует видео до 10 секунд на основе этой картинки.
- Поддерживает многотуровые сценарии через Interactions API: вы можете отправлять новые промпты с учётом истории, а не начинать каждый раз с нуля.
Текущие технические ограничения:
- Аудио на вход: вы не можете загрузить голосовую дорожку или звуковой референс — только текст и визуальные данные.
- Scene extension: нельзя «достроить» уже сгенерированную сцену за рамки исходного кадра. Например, плавно продолжить панораму — это пока недоступно.
- Видео‑референсы до 3 секунд: формально API принимает такие входы, но модель сейчас не обрабатывает их корректно. По сути, эта функция пока экспериментальная и не подходит для продакшена.
- Консистентность персонажей: при смене сцены, ракурса или панорамировании модель может менять черты лица, одежду или пропорции героев.
Что это значит для вас
Для кого это полезно
-
Дизайнеры и креаторы
- Быстро собрать статичный кадр в Nano Banana 2 Lite.
- Превратить его в короткий анимированный клип до 10 секунд в Gemini Omni Flash.
- Подходит для тизеров, промо‑картинок, коротких анимаций для соцсетей.
-
Маркетологи и продюсеры контента
- Тестировать разные визуальные концепции в формате «картинка → короткий ролик».
- Делать несколько итераций правок в одной сессии (до трёх последовательных изменений) без полного пересбора.
-
Разработчики
- Встраивать генерацию картинок и видео в свои продукты через Gemini API.
- Использовать Interactions API, чтобы сохранять контекст пользователя и историю правок.
Где это работает хорошо
- Короткие, самодостаточные сцены до 10 секунд, где не нужно сложное сюжетное развитие.
- Анимация одного кадра: логотип, персонаж, статичная иллюстрация, которую нужно «оживить».
- Быстрые прототипы визуальных идей, когда важна скорость, а не идеальная консистентность персонажей.
Где использовать пока рано
- Сторителлинг с несколькими сценами и жёсткими требованиями к внешности персонажей.
- Длинные ролики: лимит в 10 секунд делает Omni пригодным только для коротких вставок.
- Проекты, где важно точное использование видео‑референсов. Сейчас модель формально принимает такие входы, но обрабатывает их неправильно.
- Сценарии, где нужен контроль звука: загрузить аудио‑референс и синхронизировать его с видео пока нельзя.
Доступность из России
Gemini Omni и Nano Banana 2 Lite работают через Google AI Studio и Gemini API. Доступ зависит от региона аккаунта и политики Google.
Пользователям из России может понадобиться:
- учётная запись, зарегистрированная в поддерживаемом регионе;
- иногда — VPN для доступа к Google AI Studio и отдельным API‑эндпоинтам.
Перед интеграцией в продакшен имеет смысл проверить доступ на тестовом аккаунте.
Место на рынке
Google явно продвигает связку «быстрое изображение → короткое видео» как единый сценарий:
- Nano Banana 2 Lite решает задачу скоростной генерации картинок.
- Gemini Omni Flash добавляет видео до 10 секунд с учётом референса и истории правок.
Прямые числовые сравнения с другими продуктами Google не даёт: нет данных по скорости рендеринга в секундах, стоимости токена или FPS.
По функциональности связка сейчас ближе к инструменту для быстрых экспериментов, чем к полноценной киностудии:
- Плюс — быстрая генерация и единый пайплайн «картинка → видео» в рамках одного API.
- Минус — ограничения по длине ролика, проблемная работа с видео‑референсами и нестабильные персонажи при сложных движениях камеры.
Если вы уже используете экосистему Gemini и Google Cloud, Nano Banana 2 Lite и Gemini Omni Flash логично рассматривать как очередной кирпич в вашем пайплайне: особенно для коротких, визуально насыщенных, но не слишком сложных роликов.
Как запустить
Google предлагает несколько способов быстро попробовать связку Nano Banana 2 Lite + Gemini Omni Flash:
- Зайти в Google AI Studio и выбрать соответствующие модели для генерации изображения и видео.
- Использовать Gemini API и Interactions API для многотуровых сценариев с сохранением истории и до трёх последовательных правок.
- Взять готовые демо‑приложения от Google и ремиксить их под свои задачи — это самый быстрый путь понять, как собрать единый workflow из двух моделей.
Полный список возможностей, региональных ограничений и технических деталей Google публикует в документации для разработчиков Gemini — туда имеет смысл заглянуть перед интеграцией в боевой продукт.