90210: локальная фабрика короткометражек на базе Veo 3.1 и Gemini 2.5 Pro — VogueTech

Что нового

90210 — это локальное приложение, которое превращает сценарий в готовый короткий фильм. Не просто набор клипов, а связанное видео с:

синхронизированным изображением;
нативной озвучкой;
диалогами;
музыкой;
субтитрами.

Под капотом сразу несколько коммерческих AI-сервисов:

Google Veo 3.1 — генерация видео и аудио;
Nano Banana — портреты персонажей;
Gemini 2.5 Pro — «режиссёр», который управляет раскадровкой и нарративом;
ElevenLabs Music — музыкальные треки.

Создатели честно дают экономику:

Veo 3.1 / Gemini 2.5 Pro / Nano Banana: $0,10–0,40 за секунду видео (май 2026);
ElevenLabs Music: $0,01 за секунду музыки;
типичный 2‑минутный фильм обходится примерно в $20.

Отдельный блок — «Quality Oracle» и «Story Oracle». Это не маркетинг, а конкретные метрики, которые автоматически решают, когда перегенерировать кадр и когда повышать «тариф» качества.

Как это работает

90210 — это локальный стек из двух частей:

backend на FastAPI с Pydantic;
frontend на Next.js в формате PWA.

PWA ставится на главный экран iOS через Safari и работает почти как нативное приложение: открывается в отдельном окне, кэширует интерфейс, не требует отдельного клиента.

Quality Oracle: как система меряет качество

Качество видео, аудио и кадров оценивает «композитный оракул», который опирается на несколько моделей и метрик:

VideoScore — оценка общего качества видео;
ViCLIP — соответствие визуала текстовому описанию;
LAION aesthetic — «эстетичность» картинки по данным LAION;
MUSIQ — качество изображения на уровне фото/кадров;
ArcFace — совпадение лиц, консистентность персонажей между сценами;
LPIPS — перцептивное отличие между кадрами (насколько изменения видны глазу);
Whisper — распознавание речи для проверки совпадения диалога и субтитров.

Эти оценки собираются в общий скоринг. Если результат ниже порога, система автоматически делает re-roll (перегенерацию) или поднимает «tier» — использует более дорогие и качественные настройки.

Story Oracle: контроль сюжета

Отдельный блок следит за тем, чтобы история не расползалась:

Reagan-6 — разбор сценария по шести классическим сюжетным дугам;
TRIPOD — контроль ключевых поворотных точек истории;
Average Shot Length — средняя длина плана, чтобы ритм монтажа не ломал восприятие;
SBERT coherence — семантическая связность сцен и диалогов.

Если сценарий или разбиение на сцены уводит историю в сторону, Story Oracle корректирует структуру и подсказывает, какие сегменты переснять.

Архитектура

Технически всё довольно прямолинейно:

локальный FastAPI‑backend общается с API Google и ElevenLabs;
Next.js‑frontend работает как PWA, общается с backend по HTTP;
дополнительный пакет oracles подтягивает тяжёлые ML‑зависимости (около 3 ГБ), если вы хотите локально считать Quality/Story Oracle, а не полагаться только на внешние сервисы.

Документация разбита по отдельным файлам:

дизайн‑спека: docs/superpowers/specs/2026-05-09-screenplay-to-movie-design.md;
разбор Veo 3.1: docs/superpowers/research/veo-3.1-deep-dive.md;
скрипт с расчётом стоимости/задержки/качества: docs/superpowers/research/cost_latency_quality_math.py.

Что это значит для вас

Для кого это вообще нужно

90210 полезен, если вы:

сценарист, который хочет быстро увидеть черновой фильм по тексту сценария;
режиссёр или продюсер, который тестирует несколько версий сцены до съёмок;
создатель контента, который делает короткометражки, трейлеры, сторис, вертикальные видео;
продуктовый дизайнер, который проверяет сториборды и UX‑сценарии в формате видео.

Система умеет сама следить за качеством и сюжетом, поэтому вы тратите время не на ручной перебор дублей, а на правки истории и визуального стиля.

Где инструмент заходит хорошо

Использовать 90210 логично для:

раскадровок и превизов перед реальными съёмками;
питч‑роликов для инвесторов или клиентов;
обучающих и объясняющих видео по готовому тексту;
теста тональности: как сценарий звучит в реальной озвучке и монтаже.

Здесь важен именно автоматический перегенератор: вы прописываете критерии качества, а система сама добивает сцены до заданного уровня.

Где лучше не рассчитывать только на 90210

Инструмент не заменяет полноценную киносъёмку, если вам нужны:

сложная актёрская игра и тонкие эмоции;
авторская операторская работа;
юридически чистые права на использование лиц/музыки для большого проката.

Это ближе к «фабрике превизов» и быстрых коротких форматов, чем к финальному кинотеатральному релизу.

Доступность и ограничения

90210 — локальное приложение. Но оно зависит от внешних API:

Google Gemini / Veo 3.1 / Nano Banana;
ElevenLabs Music.

Если в вашем регионе эти сервисы ограничены, понадобится VPN и платёжный метод, который принимают Google и ElevenLabs. Без рабочих API‑ключей приложение не сгенерирует ни секунды видео и музыки.

Место на рынке

Создатели 90210 честно раскрывают только собственные цифры стоимости и архитектуру. Прямых сравнений с GPT‑4o, Claude 3.5, Runway, Pika и другими в исходных материалах нет.

По доступным данным можно сделать несколько выводов:

ставка $0,10–0,40 за секунду видео с Veo 3.1 и сопутствующими сервисами делает 2‑минутный ролик примерно в $20;
музыка от ElevenLabs по $0,01 за секунду — заметно меньшая часть бюджета, чем видео;
локальный backend и PWA‑frontend дают больше контроля, чем чистый облачный веб‑сервис: вы управляете своим окружением, логами, интеграциями.

На фоне классических «генераторов видео по тексту» 90210 делает акцент не на одной модели, а на связке:

генерация видео и звука через Veo 3.1;
управление историей через Gemini 2.5 Pro и Story Oracle;
автоматический контроль качества через Quality Oracle.

Сегмент, в который целит продукт, — это не массовые мем‑ролики, а пользователи, готовые платить десятки долларов за ролик ради управляемого качества и контроля над сюжетом.

Установка

90210 рассчитан на запуск локально. Понадобятся:

Python 3;
Node.js с pnpm или npm;
аккаунты и API‑ключи для Gemini и ElevenLabs.

Полная последовательность из исходных инструкций:

# 0. one-time
python3 -m venv .venv
.venv/bin/pip install -e ./backend  # installs FastAPI + Pydantic + Google + ElevenLabs deps
cp .env.example .env                # fill in GEMINI_API_KEY and ELEVENLABS_API_KEY

# 1. Backend
./run-backend.sh                    # starts uvicorn at http://localhost:8000
# (the script sets PYTHONPATH because Homebrew Python 3.14 ships its own
# sitecustomize.py that breaks venv editable installs — PYTHONPATH sidesteps it.)

# 2. Frontend (new shell)
cd frontend
pnpm install                        # or npm install
pnpm dev                            # → http://localhost:3000

# 3. iPhone access
# - same WiFi: http://<laptop-ip>:3000 → Safari Share → Add to Home Screen
# - off-WiFi: tailscale serve / funnel (see docs)

# 4. Optional Quality Oracle (heavy ML deps; ~3GB)
.venv/bin/pip install -e " ./backend[oracles] "

После этого вы получаете локальный FastAPI‑backend на http://localhost:8000 и Next.js‑frontend на http://localhost:3000. На iPhone интерфейс ставится как PWA через «Поделиться → На экран Домой» в Safari.

Если вы хотите использовать Quality Oracle и Story Oracle, не пропускайте шаг с установкой ./backend[oracles] — это дополнительные ML‑модули примерно на 3 ГБ.