Дата публикации
ai_products

Google запустила Nano Banana 2 Lite и Gemini Omni: быстрые картинки плюс видео до 10 секунд

Что нового

Google расширила линейку генеративной графики за счёт связки двух продуктов:

  • Nano Banana 2 Lite — ускоренная модель для генерации изображений.
  • Gemini Omni Flash — видеогенерация на базе Gemini Omni.

Главная идея: вы делаете картинку в Nano Banana 2 Lite и сразу же анимируете её в видео через Gemini Omni Flash.

Из конкретики по возможностям сейчас:

  • Длина видео в Gemini Omni — до 10 секунд на один запрос.
  • Поддержка видео-референсов — можно передать ролик до 3 секунд через API-схему, но модель сейчас обрабатывает их некорректно.
  • Аудио-референсы и расширение сцены (scene extension) через Gemini API пока недоступны.
  • Стабильность персонажей при смене ракурсов и панорамах ограничена: модель может «ломать» внешний вид героя между сценами.
  • Публичный превью-доступ: Gemini Omni уже можно тестировать в Google AI Studio и через Gemini API в поддерживаемых регионах.
  • Google выложила демо‑приложения, где Nano Banana 2 Lite и Gemini Omni Flash собраны в один пайплайн, и их можно ремиксить под свои задачи.

Ещё одна деталь: при использовании Interactions API можно сохранять историю сессии и контекст. Это позволяет пользователю делать до трёх последовательных правок одного видео или сцены.

Как это работает

Архитектура завязана на последовательную работу двух разных моделей Google:

  1. Nano Banana 2 Lite

    • Отвечает за быструю генерацию исходного изображения.
    • Работает как отдельная модель в экосистеме Gemini API.
    • На выходе даёт картинку, которую можно передать дальше как референс.
  2. Gemini Omni Flash (часть семейства Gemini Omni)

    • Принимает на вход изображение‑референс и текстовый запрос.
    • Генерирует видео до 10 секунд на основе этой картинки.
    • Поддерживает многотуровые сценарии через Interactions API: вы можете отправлять новые промпты с учётом истории, а не начинать каждый раз с нуля.

Текущие технические ограничения:

  • Аудио на вход: вы не можете загрузить голосовую дорожку или звуковой референс — только текст и визуальные данные.
  • Scene extension: нельзя «достроить» уже сгенерированную сцену за рамки исходного кадра. Например, плавно продолжить панораму — это пока недоступно.
  • Видео‑референсы до 3 секунд: формально API принимает такие входы, но модель сейчас не обрабатывает их корректно. По сути, эта функция пока экспериментальная и не подходит для продакшена.
  • Консистентность персонажей: при смене сцены, ракурса или панорамировании модель может менять черты лица, одежду или пропорции героев.

Что это значит для вас

Для кого это полезно

  • Дизайнеры и креаторы

    • Быстро собрать статичный кадр в Nano Banana 2 Lite.
    • Превратить его в короткий анимированный клип до 10 секунд в Gemini Omni Flash.
    • Подходит для тизеров, промо‑картинок, коротких анимаций для соцсетей.
  • Маркетологи и продюсеры контента

    • Тестировать разные визуальные концепции в формате «картинка → короткий ролик».
    • Делать несколько итераций правок в одной сессии (до трёх последовательных изменений) без полного пересбора.
  • Разработчики

    • Встраивать генерацию картинок и видео в свои продукты через Gemini API.
    • Использовать Interactions API, чтобы сохранять контекст пользователя и историю правок.

Где это работает хорошо

  • Короткие, самодостаточные сцены до 10 секунд, где не нужно сложное сюжетное развитие.
  • Анимация одного кадра: логотип, персонаж, статичная иллюстрация, которую нужно «оживить».
  • Быстрые прототипы визуальных идей, когда важна скорость, а не идеальная консистентность персонажей.

Где использовать пока рано

  • Сторителлинг с несколькими сценами и жёсткими требованиями к внешности персонажей.
  • Длинные ролики: лимит в 10 секунд делает Omni пригодным только для коротких вставок.
  • Проекты, где важно точное использование видео‑референсов. Сейчас модель формально принимает такие входы, но обрабатывает их неправильно.
  • Сценарии, где нужен контроль звука: загрузить аудио‑референс и синхронизировать его с видео пока нельзя.

Доступность из России

Gemini Omni и Nano Banana 2 Lite работают через Google AI Studio и Gemini API. Доступ зависит от региона аккаунта и политики Google.

Пользователям из России может понадобиться:

  • учётная запись, зарегистрированная в поддерживаемом регионе;
  • иногда — VPN для доступа к Google AI Studio и отдельным API‑эндпоинтам.

Перед интеграцией в продакшен имеет смысл проверить доступ на тестовом аккаунте.

Место на рынке

Google явно продвигает связку «быстрое изображение → короткое видео» как единый сценарий:

  • Nano Banana 2 Lite решает задачу скоростной генерации картинок.
  • Gemini Omni Flash добавляет видео до 10 секунд с учётом референса и истории правок.

Прямые числовые сравнения с другими продуктами Google не даёт: нет данных по скорости рендеринга в секундах, стоимости токена или FPS.

По функциональности связка сейчас ближе к инструменту для быстрых экспериментов, чем к полноценной киностудии:

  • Плюс — быстрая генерация и единый пайплайн «картинка → видео» в рамках одного API.
  • Минус — ограничения по длине ролика, проблемная работа с видео‑референсами и нестабильные персонажи при сложных движениях камеры.

Если вы уже используете экосистему Gemini и Google Cloud, Nano Banana 2 Lite и Gemini Omni Flash логично рассматривать как очередной кирпич в вашем пайплайне: особенно для коротких, визуально насыщенных, но не слишком сложных роликов.

Как запустить

Google предлагает несколько способов быстро попробовать связку Nano Banana 2 Lite + Gemini Omni Flash:

  • Зайти в Google AI Studio и выбрать соответствующие модели для генерации изображения и видео.
  • Использовать Gemini API и Interactions API для многотуровых сценариев с сохранением истории и до трёх последовательных правок.
  • Взять готовые демо‑приложения от Google и ремиксить их под свои задачи — это самый быстрый путь понять, как собрать единый workflow из двух моделей.

Полный список возможностей, региональных ограничений и технических деталей Google публикует в документации для разработчиков Gemini — туда имеет смысл заглянуть перед интеграцией в боевой продукт.


Читайте также