- Дата публикации
90210: локальная фабрика короткометражек на базе Veo 3.1 и Gemini 2.5 Pro
Что нового
90210 — это локальное приложение, которое превращает сценарий в готовый короткий фильм. Не просто набор клипов, а связанное видео с:
- синхронизированным изображением;
- нативной озвучкой;
- диалогами;
- музыкой;
- субтитрами.
Под капотом сразу несколько коммерческих AI-сервисов:
- Google Veo 3.1 — генерация видео и аудио;
- Nano Banana — портреты персонажей;
- Gemini 2.5 Pro — «режиссёр», который управляет раскадровкой и нарративом;
- ElevenLabs Music — музыкальные треки.
Создатели честно дают экономику:
- Veo 3.1 / Gemini 2.5 Pro / Nano Banana: $0,10–0,40 за секунду видео (май 2026);
- ElevenLabs Music: $0,01 за секунду музыки;
- типичный 2‑минутный фильм обходится примерно в $20.
Отдельный блок — «Quality Oracle» и «Story Oracle». Это не маркетинг, а конкретные метрики, которые автоматически решают, когда перегенерировать кадр и когда повышать «тариф» качества.
Как это работает
90210 — это локальный стек из двух частей:
- backend на FastAPI с Pydantic;
- frontend на Next.js в формате PWA.
PWA ставится на главный экран iOS через Safari и работает почти как нативное приложение: открывается в отдельном окне, кэширует интерфейс, не требует отдельного клиента.
Quality Oracle: как система меряет качество
Качество видео, аудио и кадров оценивает «композитный оракул», который опирается на несколько моделей и метрик:
- VideoScore — оценка общего качества видео;
- ViCLIP — соответствие визуала текстовому описанию;
- LAION aesthetic — «эстетичность» картинки по данным LAION;
- MUSIQ — качество изображения на уровне фото/кадров;
- ArcFace — совпадение лиц, консистентность персонажей между сценами;
- LPIPS — перцептивное отличие между кадрами (насколько изменения видны глазу);
- Whisper — распознавание речи для проверки совпадения диалога и субтитров.
Эти оценки собираются в общий скоринг. Если результат ниже порога, система автоматически делает re-roll (перегенерацию) или поднимает «tier» — использует более дорогие и качественные настройки.
Story Oracle: контроль сюжета
Отдельный блок следит за тем, чтобы история не расползалась:
- Reagan-6 — разбор сценария по шести классическим сюжетным дугам;
- TRIPOD — контроль ключевых поворотных точек истории;
- Average Shot Length — средняя длина плана, чтобы ритм монтажа не ломал восприятие;
- SBERT coherence — семантическая связность сцен и диалогов.
Если сценарий или разбиение на сцены уводит историю в сторону, Story Oracle корректирует структуру и подсказывает, какие сегменты переснять.
Архитектура
Технически всё довольно прямолинейно:
- локальный FastAPI‑backend общается с API Google и ElevenLabs;
- Next.js‑frontend работает как PWA, общается с backend по HTTP;
- дополнительный пакет
oraclesподтягивает тяжёлые ML‑зависимости (около 3 ГБ), если вы хотите локально считать Quality/Story Oracle, а не полагаться только на внешние сервисы.
Документация разбита по отдельным файлам:
- дизайн‑спека:
docs/superpowers/specs/2026-05-09-screenplay-to-movie-design.md; - разбор Veo 3.1:
docs/superpowers/research/veo-3.1-deep-dive.md; - скрипт с расчётом стоимости/задержки/качества:
docs/superpowers/research/cost_latency_quality_math.py.
Что это значит для вас
Для кого это вообще нужно
90210 полезен, если вы:
- сценарист, который хочет быстро увидеть черновой фильм по тексту сценария;
- режиссёр или продюсер, который тестирует несколько версий сцены до съёмок;
- создатель контента, который делает короткометражки, трейлеры, сторис, вертикальные видео;
- продуктовый дизайнер, который проверяет сториборды и UX‑сценарии в формате видео.
Система умеет сама следить за качеством и сюжетом, поэтому вы тратите время не на ручной перебор дублей, а на правки истории и визуального стиля.
Где инструмент заходит хорошо
Использовать 90210 логично для:
- раскадровок и превизов перед реальными съёмками;
- питч‑роликов для инвесторов или клиентов;
- обучающих и объясняющих видео по готовому тексту;
- теста тональности: как сценарий звучит в реальной озвучке и монтаже.
Здесь важен именно автоматический перегенератор: вы прописываете критерии качества, а система сама добивает сцены до заданного уровня.
Где лучше не рассчитывать только на 90210
Инструмент не заменяет полноценную киносъёмку, если вам нужны:
- сложная актёрская игра и тонкие эмоции;
- авторская операторская работа;
- юридически чистые права на использование лиц/музыки для большого проката.
Это ближе к «фабрике превизов» и быстрых коротких форматов, чем к финальному кинотеатральному релизу.
Доступность и ограничения
90210 — локальное приложение. Но оно зависит от внешних API:
- Google Gemini / Veo 3.1 / Nano Banana;
- ElevenLabs Music.
Если в вашем регионе эти сервисы ограничены, понадобится VPN и платёжный метод, который принимают Google и ElevenLabs. Без рабочих API‑ключей приложение не сгенерирует ни секунды видео и музыки.
Место на рынке
Создатели 90210 честно раскрывают только собственные цифры стоимости и архитектуру. Прямых сравнений с GPT‑4o, Claude 3.5, Runway, Pika и другими в исходных материалах нет.
По доступным данным можно сделать несколько выводов:
- ставка $0,10–0,40 за секунду видео с Veo 3.1 и сопутствующими сервисами делает 2‑минутный ролик примерно в $20;
- музыка от ElevenLabs по $0,01 за секунду — заметно меньшая часть бюджета, чем видео;
- локальный backend и PWA‑frontend дают больше контроля, чем чистый облачный веб‑сервис: вы управляете своим окружением, логами, интеграциями.
На фоне классических «генераторов видео по тексту» 90210 делает акцент не на одной модели, а на связке:
- генерация видео и звука через Veo 3.1;
- управление историей через Gemini 2.5 Pro и Story Oracle;
- автоматический контроль качества через Quality Oracle.
Сегмент, в который целит продукт, — это не массовые мем‑ролики, а пользователи, готовые платить десятки долларов за ролик ради управляемого качества и контроля над сюжетом.
Установка
90210 рассчитан на запуск локально. Понадобятся:
- Python 3;
- Node.js с pnpm или npm;
- аккаунты и API‑ключи для Gemini и ElevenLabs.
Полная последовательность из исходных инструкций:
# 0. one-time
python3 -m venv .venv
.venv/bin/pip install -e ./backend # installs FastAPI + Pydantic + Google + ElevenLabs deps
cp .env.example .env # fill in GEMINI_API_KEY and ELEVENLABS_API_KEY
# 1. Backend
./run-backend.sh # starts uvicorn at http://localhost:8000
# (the script sets PYTHONPATH because Homebrew Python 3.14 ships its own
# sitecustomize.py that breaks venv editable installs — PYTHONPATH sidesteps it.)
# 2. Frontend (new shell)
cd frontend
pnpm install # or npm install
pnpm dev # → http://localhost:3000
# 3. iPhone access
# - same WiFi: http://<laptop-ip>:3000 → Safari Share → Add to Home Screen
# - off-WiFi: tailscale serve / funnel (see docs)
# 4. Optional Quality Oracle (heavy ML deps; ~3GB)
.venv/bin/pip install -e " ./backend[oracles] "
После этого вы получаете локальный FastAPI‑backend на http://localhost:8000 и Next.js‑frontend на http://localhost:3000. На iPhone интерфейс ставится как PWA через «Поделиться → На экран Домой» в Safari.
Если вы хотите использовать Quality Oracle и Story Oracle, не пропускайте шаг с установкой ./backend[oracles] — это дополнительные ML‑модули примерно на 3 ГБ.