AlphaEvolve от Google DeepMind: агент для поиска алгоритмов, который уже экономит деньги и ускоряет науку — VogueTech

Что нового

Google DeepMind год назад запустила AlphaEvolve — агента на базе Gemini, который не пишет обычный код, а проектирует и улучшает алгоритмы. За год он из исследовательского проекта превратился в инфраструктурный инструмент Google и коммерческий продукт через Google Cloud.

Ключевые результаты за первый год:

Геномика: улучшение модели DeepConsensus для исправления ошибок секвенирования ДНК. Ошибки при обнаружении генетических вариантов снизились на 30%. PacBio получает более точные данные дешевле.
Энергетика: в задаче AC Optimal Power Flow AlphaEvolve поднял долю корректных решений графовой нейросети с 14% до более чем 88%. Это уменьшает дорогой постпроцессинг в энергосетях.
Риск стихийных бедствий: автоматическая оптимизация Earth AI моделей дала +5% к точности предсказания риска катастроф по 20 категориям (пожары, наводнения, торнадо и др.).
Квантовая физика: для процессора Google Willow агент предложил квантовые схемы с в 10 раз меньшей ошибкой, чем лучшие классические оптимизации. Это позволило провести новые эксперименты по квантовым вычислениям.
Математика: совместно с Терренсом Тао AlphaEvolve помог в задачах Эрдёша, улучшил нижние оценки для задачи коммивояжёра и чисел Рамсея, а также генерировал решения к задачам вроде «проблемы Таммса».
Аппаратное обеспечение: агент регулярно используют при проектировании следующего поколения TPU. Он предложил нетривиальную схему, которую Google интегрировала прямо в кристалл. Также агент нашёл новые политики замены кэша за 2 дня — раньше подобная работа занимала месяцы.
Google Spanner: оптимизация эвристик компакции LSM-деревьев снизила write amplification на 20% и сократила размер бинарей почти на 9%.
Финтех (Klarna): оптимизация одного из крупнейших трансформеров — в 2 раза быстрее обучение при одновременном росте качества модели.
Полупроводники (Substrate): многократное ускорение вычислительной литографии, появилась возможность прогонять гораздо более крупные симуляции чипов.
Логистика (FM Logistic): улучшение маршрутизации (вариант задачи коммивояжёра) на 10,4% по эффективности, экономия более 15 000 км пробега в год.
Маркетинг (WPP): +10% точности моделей по сравнению с уже вручную оптимизированными решениями.
Материаловедение и фарма (Schrödinger): примерно 4-кратное ускорение обучения и инференса MLFF (Machine Learned Force Fields).

Параллельно Google DeepMind и Google Cloud построили UI и API для AlphaEvolve и начали подключать внешние компании в разных отраслях.

Как это работает

AlphaEvolve — это не одна модель, а агентная система поверх Gemini, заточенная под поиск и улучшение алгоритмов.

В общих чертах цикл работы выглядит так:

Формулировка задачи
Исследователь или инженер задаёт:
- формальное описание задачи (например, AC Optimal Power Flow, компакция LSM-дерева, маршрутная оптимизация);
- метрику качества (точность, скорость, энергопотребление, стоимость);
- ограничения (память, время, совместимость с существующей инфраструктурой).
Генерация кандидатов-алгоритмов
Gemini выступает «мозгом» агента и генерирует варианты:
- новые эвристики;
- варианты архитектур нейросетей (например, GNN для энергосетей);
- конфигурации квантовых схем;
- политики замены кэша;
- стратегии компиляции и оптимизации кода.
Автоматический экспериментальный цикл
Для каждого кандидата система:
- компилирует и запускает код в тестовом окружении;
- прогоняет на наборах задач или симуляторах (энергосети, квантовые схемы, маршруты, геоданные);
- собирает метрики: точность, время, энергопотребление, объём записи на диск и т.д.
Поиск по пространству решений
AlphaEvolve использует машинное обучение и методы оптимизации, чтобы:
- выбирать, какие варианты стоит пробовать дальше;
- комбинировать удачные идеи из разных кандидатов;
- систематически улучшать решения по заданной метрике.
Интеграция в продакшн
Когда агент находит алгоритм, который стабильно лучше текущего:
- инженеры Google встраивают его в системы (TPU, Spanner, квантовые эксперименты);
- партнёры внедряют решения в свои пайплайны (литография, маршрутизация, модели для рекламы, MLFF).

Примеры «под капотом» по областям:

Геномика: агент перебирает архитектуры и гиперпараметры для DeepConsensus, минимизируя ошибки распознавания вариантов в данных секвенирования.
Энергосети: AlphaEvolve обучает и донастраивает графовые нейросети, которые приближённо решают AC Optimal Power Flow, и проверяет их решения на физическую реализуемость.
Квантовые схемы: система генерирует варианты квантовых цепей для молекулярных симуляций и оценивает суммарную ошибку на процессоре Willow. Цель — минимизировать шум при заданных ресурсах.
Аппаратное обеспечение и кэш: агент работает с симуляторами железа, где можно измерить пропускную способность, задержки и hit rate кэша для разных политик замены. Он ищет схемы, которые человек-инженер вряд ли предложит интуитивно.
Spanner и компиляторы: AlphaEvolve экспериментирует с параметрами компакции LSM-деревьев и стратегиями компиляции. Он измеряет write amplification, размер бинарей и производительность.

По сути, это автоматизированный «исследователь-оптимизатор», который умеет ставить и проверять тысячи гипотез, опираясь на Gemini как на языковой и кодовый мозг.

Что это значит для вас

Кому AlphaEvolve действительно полезен

Инженерам инфраструктуры и SRE
Если вы оптимизируете базы данных, распределённые системы, компиляторы или аппаратное обеспечение, подобный агент может:
- искать новые эвристики и политики (кэш, планировщики, индексы);
- выжимать дополнительные проценты производительности и сокращать затраты;
- автоматизировать рутинный перебор конфигураций и тестов.
Пример: в Spanner снижение write amplification на 20% — это прямая экономия на дисках и улучшение латентности.
Data Science и ML-командам
Агент помогает не только писать код, но и:
- проектировать архитектуры моделей под конкретные ограничения;
- ускорять обучение без потери качества (как в кейсе Klarna — 2x ускорение + рост качества);
- оптимизировать inference-часть (пример Schrödinger: ~4x ускорение MLFF).
Учёным в прикладных науках
Если вы работаете в геномике, материаловедении, квантовой химии, физике или климате, AlphaEvolve показывает, что:
- можно делегировать поиск численных методов и алгоритмов;
- получать более точные симуляции при тех же ресурсах (пример с квантовым процессором Willow);
- улучшать обработку геоданных и прогнозы рисков (пример Earth AI с +5% точности).
Логистика, финансы, маркетинг
Для задач оптимизации и работы с большими табличными и временными данными агент даёт:
- улучшение маршрутов и планирования (FM Logistic +10,4% эффективности и -15 000 км в год);
- ускорение и улучшение качества моделей для кредитного скоринга, рекомендаций и т.д. (пример Klarna);
- тонкую настройку моделей для рекламных кампаний (+10% точности у WPP).

Где AlphaEvolve пока не ваш инструмент

Обычная разработка приложений. Это не помощник уровня «напиши мне фронтенд на React». Его зона — сложные алгоритмы и оптимизация.
Малый бизнес без инженерной команды. Текущие кейсы — крупные корпорации, лаборатории и инфраструктурные команды. Нужны данные, симуляторы, CI/CD и люди, которые смогут внедрить найденные решения.
Креативные задачи без чётких метрик. AlphaEvolve силён там, где есть формальная метрика: скорость, точность, стоимость. Для брендинга, дизайна или текстов подойдёт классический LLM вроде GPT-4o, Claude 3 или Gemini.

Доступность и правовые нюансы

AlphaEvolve работает внутри Google DeepMind и Google Cloud. Прямого публичного доступа «зарегистрироваться и попробовать» нет. Компании подключают через Google Cloud в формате партнёрских проектов.

Для пользователей из России это значит:

нужен доступ к сервисам Google Cloud, которые официально в России недоступны;
юридически и технически подключить AlphaEvolve напрямую сейчас практически нереально.

Если вы работаете в международной компании с инфраструктурой в других юрисдикциях, путь один — обсуждать пилот с Google Cloud через глобальные офисы.

Место на рынке

По типу продукта AlphaEvolve ближе к внутренним агентам для оптимизации инфраструктуры, которые развивают крупные игроки (например, AutoML-системы, внутренние оптимизаторы hardware/software у крупных облаков).

В открытом доступе нет прямых численных сравнений AlphaEvolve с:

GPT-4o или GPT-4 Turbo от OpenAI;
Claude 3 от Anthropic;
другими коммерческими агентами.

Но по описанию кейсов можно провести качественное сравнение по роли:

GPT-4o, Claude 3, публичный Gemini — универсальные ассистенты: код, тексты, анализ данных. Они помогают человеку, но не управляют полноценно экспериментами в продакшн-инфраструктуре.
AlphaEvolve — специализированный «исследователь-агент» для алгоритмов, тесно интегрированный в системы Google (TPU, Spanner, квантовые процессоры, Earth AI) и проекты Google Cloud.

Формат использования тоже разный:

GPT-4o и Claude 3 доступны по API с понятной ценой за токен.
AlphaEvolve доступен как часть кастомных проектов с Google Cloud, без открытого прайсинга и без self-service.

Если вам нужен ассистент-разработчик или аналитик, проще и дешевле использовать GPT-4o, Claude 3 или публичный Gemini. Если вы строите крупную инфраструктуру на Google Cloud и готовы к совместным R&D-проектам, AlphaEvolve — инструмент другого класса, но он требует отдельного контракта и глубокой интеграции.

Что можно взять уже сейчас, даже без доступа к AlphaEvolve

Даже если вы не можете напрямую использовать AlphaEvolve, из его кейсов можно вынести несколько практических идей:

Формализуйте метрики. Все успехи — от геномики до логистики — опираются на чёткую метрику: ошибка, скорость, write amplification, километры пробега.
Стройте симуляторы. Агент смог оптимизировать кэш, энергосети и литографию, потому что у команд были симуляторы и тестовые стенды.
Автоматизируйте поиск гипотез. Даже с обычным LLM (GPT-4o, Claude 3, Gemini) можно строить простые агенты, которые:
- генерируют варианты алгоритмов;
- запускают тесты в CI;
- собирают метрики и отбирают лучшие.
Инвестируйте в инфраструктуру экспериментов. Чем проще запускать тысячи экспериментов, тем больше пользы вы получите от любого агента, даже если он не AlphaEvolve.

AlphaEvolve показывает, как может выглядеть следующий шаг: не просто «ИИ, который пишет код», а система, которая систематически ищет и проверяет новые алгоритмы, а затем помогает инженерам превратить их в реальный продукт.