- Дата публикации
Grok Imagine от Илона Маска научился оживлять фото и собирать людей из разных кадров в одно видео
Что нового
Grok Imagine — визуальный сервис от X (бывший Twitter) и Илона Маска — получил новую функцию: теперь он умеет анимировать статичные фотографии и «склеивать» людей и объекты с разных снимков в один общий видеокадр.
Что прямо сейчас умеет Grok Imagine, исходя из анонса в X:
- Анимация статичных изображений. Берёте обычное фото — на выходе получаете короткое видео.
- Комбинация нескольких фото в один шот. Сервис может собрать в одном кадре людей и сцены, которые изначально были сняты по отдельности.
- Генерация любой сцены, персонажа и места. В промо-посте команда пишет: «Any scene, any character, any place!» — то есть можно описать желаемый сеттинг и персонажей.
- Доступность в нескольких интерфейсах. Функция уже работает в приложении Grok и в веб-версии.
Цифр по длине роликов, стоимости генерации или лимитам контекста команда X не привела. Из поста известно только время анонса (18 апреля 2026 года, 23:48 по UTC) и базовая метрика охвата: 7 577 просмотров твита на момент скриншота.
Как это работает
Команда Grok Imagine не раскрыла архитектуру сервиса, но по описанию можно аккуратно реконструировать общий принцип.
Под капотом, с высокой вероятностью, сочетаются три типа технологий:
-
Модель для анализа изображений.
- Определяет людей, фон, объекты и их позы на каждой загруженной фотографии.
- Строит «скелет» сцены: где кто стоит, куда смотрит, как распределён свет.
-
Модель для генерации видео.
- На вход получает описание сцены (текст + распознанные объекты с фото).
- Строит последовательность кадров, где персонажи двигаются, но сохраняют ключевые черты с исходных снимков.
-
Механизм совмещения нескольких источников.
- Сопоставляет людей и объекты из разных фото с единой виртуальной сценой.
- Приводит к общему освещению и перспективе, чтобы в итоговом видео всё выглядело как один шот, а не монтаж из коллажей.
Grok Imagine работает как сервис X: вся обработка проходит в облаке X Corp. Пользователь загружает фото, задаёт сцену или персонажей, дальше система генерирует анимацию и отрисовывает короткий ролик.
Что это значит для вас
Новая функция Grok Imagine полезна, если вы работаете с визуальным контентом и вам нужно быстро получать видео без съёмки.
Где это особенно уместно:
-
Соцсети и личный бренд.
- Оживить статичные портреты для сторис или постов.
- Собрать «общее» видео с друзьями или коллегами, даже если вы не встречались офлайн.
-
Маркетинг и промо.
- Быстро сделать динамичный тизер из набора продуктовых фото.
- Скомбинировать людей из разных фотосессий в одну сцену, не заказывая отдельную видеосъёмку.
-
Креатив и сторителлинг.
- Придумывать короткие визуальные истории: «любой персонаж, любая сцена, любое место».
- Использовать как быстрый прототип для раскадровок и концептов.
Где лучше не полагаться на Grok Imagine:
-
Коммерческая реклама с жёсткими юридическими требованиями.
- Нужны чёткие права на изображения людей и локаций.
- AI-анимация может искажать внешность — это риск для контрактов с моделями и брендами.
-
Чувствительные темы и персональные данные.
- Не стоит загружать фотографии людей без их согласия.
- Любой облачный сервис — это передача изображения на сторонние сервера.
Доступность для России: Grok Imagine живёт внутри экосистемы X. Если X в вашем регионе ограничен, понадобится VPN и аккаунт в X, чтобы пользоваться приложением и веб-версией.
Место на рынке
По описанию Grok Imagine конкурирует с несколькими классами сервисов:
- AI-анимация фото (аналогии: сервисы, которые оживляют портреты).
- Текст‑в‑видео и изображение‑в‑видео (генерация коротких роликов по описанию или картинке).
- Композиция сцен из нескольких источников (сборка людей и объектов в единый кадр).
Конкретные параметры — скорость генерации, разрешение видео, длина роликов, стоимость — команда Grok Imagine в анонсе не раскрыла. Поэтому сейчас можно зафиксировать только то, что:
- Сервис уже работает в продакшене: доступен в приложении Grok и в вебе.
- Упор сделан на простоту: «Any scene, any character, any place!» — ориентир на массового пользователя X, а не только на профессионалов.
Главное отличие Grok Imagine — тесная интеграция с X. Это удобно, если вы уже живёте в экосистеме Маска: Grok для текста, X для дистрибуции контента, Grok Imagine для картинок и видео.
Если вы делаете контент под X и вам важна скорость, новая функция Grok Imagine выглядит как ещё один быстрый генератор визуалов — особенно для тех, кто не хочет разбираться в сложных настройках профессиональных видеоредакторов.