Дата публикации
ai_products

AlphaEvolve от Google DeepMind: агент для поиска алгоритмов, который уже экономит деньги и ускоряет науку

Что нового

Google DeepMind год назад запустила AlphaEvolve — агента на базе Gemini, который не пишет обычный код, а проектирует и улучшает алгоритмы. За год он из исследовательского проекта превратился в инфраструктурный инструмент Google и коммерческий продукт через Google Cloud.

Ключевые результаты за первый год:

  • Геномика: улучшение модели DeepConsensus для исправления ошибок секвенирования ДНК. Ошибки при обнаружении генетических вариантов снизились на 30%. PacBio получает более точные данные дешевле.
  • Энергетика: в задаче AC Optimal Power Flow AlphaEvolve поднял долю корректных решений графовой нейросети с 14% до более чем 88%. Это уменьшает дорогой постпроцессинг в энергосетях.
  • Риск стихийных бедствий: автоматическая оптимизация Earth AI моделей дала +5% к точности предсказания риска катастроф по 20 категориям (пожары, наводнения, торнадо и др.).
  • Квантовая физика: для процессора Google Willow агент предложил квантовые схемы с в 10 раз меньшей ошибкой, чем лучшие классические оптимизации. Это позволило провести новые эксперименты по квантовым вычислениям.
  • Математика: совместно с Терренсом Тао AlphaEvolve помог в задачах Эрдёша, улучшил нижние оценки для задачи коммивояжёра и чисел Рамсея, а также генерировал решения к задачам вроде «проблемы Таммса».
  • Аппаратное обеспечение: агент регулярно используют при проектировании следующего поколения TPU. Он предложил нетривиальную схему, которую Google интегрировала прямо в кристалл. Также агент нашёл новые политики замены кэша за 2 дня — раньше подобная работа занимала месяцы.
  • Google Spanner: оптимизация эвристик компакции LSM-деревьев снизила write amplification на 20% и сократила размер бинарей почти на 9%.
  • Финтех (Klarna): оптимизация одного из крупнейших трансформеров — в 2 раза быстрее обучение при одновременном росте качества модели.
  • Полупроводники (Substrate): многократное ускорение вычислительной литографии, появилась возможность прогонять гораздо более крупные симуляции чипов.
  • Логистика (FM Logistic): улучшение маршрутизации (вариант задачи коммивояжёра) на 10,4% по эффективности, экономия более 15 000 км пробега в год.
  • Маркетинг (WPP): +10% точности моделей по сравнению с уже вручную оптимизированными решениями.
  • Материаловедение и фарма (Schrödinger): примерно 4-кратное ускорение обучения и инференса MLFF (Machine Learned Force Fields).

Параллельно Google DeepMind и Google Cloud построили UI и API для AlphaEvolve и начали подключать внешние компании в разных отраслях.

Как это работает

AlphaEvolve — это не одна модель, а агентная система поверх Gemini, заточенная под поиск и улучшение алгоритмов.

В общих чертах цикл работы выглядит так:

  1. Формулировка задачи
    Исследователь или инженер задаёт:

    • формальное описание задачи (например, AC Optimal Power Flow, компакция LSM-дерева, маршрутная оптимизация);
    • метрику качества (точность, скорость, энергопотребление, стоимость);
    • ограничения (память, время, совместимость с существующей инфраструктурой).
  2. Генерация кандидатов-алгоритмов
    Gemini выступает «мозгом» агента и генерирует варианты:

    • новые эвристики;
    • варианты архитектур нейросетей (например, GNN для энергосетей);
    • конфигурации квантовых схем;
    • политики замены кэша;
    • стратегии компиляции и оптимизации кода.
  3. Автоматический экспериментальный цикл
    Для каждого кандидата система:

    • компилирует и запускает код в тестовом окружении;
    • прогоняет на наборах задач или симуляторах (энергосети, квантовые схемы, маршруты, геоданные);
    • собирает метрики: точность, время, энергопотребление, объём записи на диск и т.д.
  4. Поиск по пространству решений
    AlphaEvolve использует машинное обучение и методы оптимизации, чтобы:

    • выбирать, какие варианты стоит пробовать дальше;
    • комбинировать удачные идеи из разных кандидатов;
    • систематически улучшать решения по заданной метрике.
  5. Интеграция в продакшн
    Когда агент находит алгоритм, который стабильно лучше текущего:

    • инженеры Google встраивают его в системы (TPU, Spanner, квантовые эксперименты);
    • партнёры внедряют решения в свои пайплайны (литография, маршрутизация, модели для рекламы, MLFF).

Примеры «под капотом» по областям:

  • Геномика: агент перебирает архитектуры и гиперпараметры для DeepConsensus, минимизируя ошибки распознавания вариантов в данных секвенирования.
  • Энергосети: AlphaEvolve обучает и донастраивает графовые нейросети, которые приближённо решают AC Optimal Power Flow, и проверяет их решения на физическую реализуемость.
  • Квантовые схемы: система генерирует варианты квантовых цепей для молекулярных симуляций и оценивает суммарную ошибку на процессоре Willow. Цель — минимизировать шум при заданных ресурсах.
  • Аппаратное обеспечение и кэш: агент работает с симуляторами железа, где можно измерить пропускную способность, задержки и hit rate кэша для разных политик замены. Он ищет схемы, которые человек-инженер вряд ли предложит интуитивно.
  • Spanner и компиляторы: AlphaEvolve экспериментирует с параметрами компакции LSM-деревьев и стратегиями компиляции. Он измеряет write amplification, размер бинарей и производительность.

По сути, это автоматизированный «исследователь-оптимизатор», который умеет ставить и проверять тысячи гипотез, опираясь на Gemini как на языковой и кодовый мозг.

Что это значит для вас

Кому AlphaEvolve действительно полезен

  1. Инженерам инфраструктуры и SRE
    Если вы оптимизируете базы данных, распределённые системы, компиляторы или аппаратное обеспечение, подобный агент может:

    • искать новые эвристики и политики (кэш, планировщики, индексы);
    • выжимать дополнительные проценты производительности и сокращать затраты;
    • автоматизировать рутинный перебор конфигураций и тестов.

    Пример: в Spanner снижение write amplification на 20% — это прямая экономия на дисках и улучшение латентности.

  2. Data Science и ML-командам
    Агент помогает не только писать код, но и:

    • проектировать архитектуры моделей под конкретные ограничения;
    • ускорять обучение без потери качества (как в кейсе Klarna — 2x ускорение + рост качества);
    • оптимизировать inference-часть (пример Schrödinger: ~4x ускорение MLFF).
  3. Учёным в прикладных науках
    Если вы работаете в геномике, материаловедении, квантовой химии, физике или климате, AlphaEvolve показывает, что:

    • можно делегировать поиск численных методов и алгоритмов;
    • получать более точные симуляции при тех же ресурсах (пример с квантовым процессором Willow);
    • улучшать обработку геоданных и прогнозы рисков (пример Earth AI с +5% точности).
  4. Логистика, финансы, маркетинг
    Для задач оптимизации и работы с большими табличными и временными данными агент даёт:

    • улучшение маршрутов и планирования (FM Logistic +10,4% эффективности и -15 000 км в год);
    • ускорение и улучшение качества моделей для кредитного скоринга, рекомендаций и т.д. (пример Klarna);
    • тонкую настройку моделей для рекламных кампаний (+10% точности у WPP).

Где AlphaEvolve пока не ваш инструмент

  • Обычная разработка приложений. Это не помощник уровня «напиши мне фронтенд на React». Его зона — сложные алгоритмы и оптимизация.
  • Малый бизнес без инженерной команды. Текущие кейсы — крупные корпорации, лаборатории и инфраструктурные команды. Нужны данные, симуляторы, CI/CD и люди, которые смогут внедрить найденные решения.
  • Креативные задачи без чётких метрик. AlphaEvolve силён там, где есть формальная метрика: скорость, точность, стоимость. Для брендинга, дизайна или текстов подойдёт классический LLM вроде GPT-4o, Claude 3 или Gemini.

Доступность и правовые нюансы

AlphaEvolve работает внутри Google DeepMind и Google Cloud. Прямого публичного доступа «зарегистрироваться и попробовать» нет. Компании подключают через Google Cloud в формате партнёрских проектов.

Для пользователей из России это значит:

  • нужен доступ к сервисам Google Cloud, которые официально в России недоступны;
  • юридически и технически подключить AlphaEvolve напрямую сейчас практически нереально.

Если вы работаете в международной компании с инфраструктурой в других юрисдикциях, путь один — обсуждать пилот с Google Cloud через глобальные офисы.

Место на рынке

По типу продукта AlphaEvolve ближе к внутренним агентам для оптимизации инфраструктуры, которые развивают крупные игроки (например, AutoML-системы, внутренние оптимизаторы hardware/software у крупных облаков).

В открытом доступе нет прямых численных сравнений AlphaEvolve с:

  • GPT-4o или GPT-4 Turbo от OpenAI;
  • Claude 3 от Anthropic;
  • другими коммерческими агентами.

Но по описанию кейсов можно провести качественное сравнение по роли:

  • GPT-4o, Claude 3, публичный Gemini — универсальные ассистенты: код, тексты, анализ данных. Они помогают человеку, но не управляют полноценно экспериментами в продакшн-инфраструктуре.
  • AlphaEvolve — специализированный «исследователь-агент» для алгоритмов, тесно интегрированный в системы Google (TPU, Spanner, квантовые процессоры, Earth AI) и проекты Google Cloud.

Формат использования тоже разный:

  • GPT-4o и Claude 3 доступны по API с понятной ценой за токен.
  • AlphaEvolve доступен как часть кастомных проектов с Google Cloud, без открытого прайсинга и без self-service.

Если вам нужен ассистент-разработчик или аналитик, проще и дешевле использовать GPT-4o, Claude 3 или публичный Gemini. Если вы строите крупную инфраструктуру на Google Cloud и готовы к совместным R&D-проектам, AlphaEvolve — инструмент другого класса, но он требует отдельного контракта и глубокой интеграции.

Что можно взять уже сейчас, даже без доступа к AlphaEvolve

Даже если вы не можете напрямую использовать AlphaEvolve, из его кейсов можно вынести несколько практических идей:

  1. Формализуйте метрики. Все успехи — от геномики до логистики — опираются на чёткую метрику: ошибка, скорость, write amplification, километры пробега.
  2. Стройте симуляторы. Агент смог оптимизировать кэш, энергосети и литографию, потому что у команд были симуляторы и тестовые стенды.
  3. Автоматизируйте поиск гипотез. Даже с обычным LLM (GPT-4o, Claude 3, Gemini) можно строить простые агенты, которые:
    • генерируют варианты алгоритмов;
    • запускают тесты в CI;
    • собирают метрики и отбирают лучшие.
  4. Инвестируйте в инфраструктуру экспериментов. Чем проще запускать тысячи экспериментов, тем больше пользы вы получите от любого агента, даже если он не AlphaEvolve.

AlphaEvolve показывает, как может выглядеть следующий шаг: не просто «ИИ, который пишет код», а система, которая систематически ищет и проверяет новые алгоритмы, а затем помогает инженерам превратить их в реальный продукт.


Читайте также