Дата публикации
ai_products

Zatom‑1: базовая ИИ‑модель, которая одновременно генерирует и предсказывает свойства 3D‑молекул и материалов

Что появилось / что изменилось

Исследователи представили Zatom‑1 — базовую модель для 3D‑химии, которая работает сразу с двумя задачами:

  • генерирует новые молекулы и кристаллические материалы в 3D;
  • предсказывает их свойства, энергии и силы на атомах.

Главное отличие от большинства существующих подходов:

  • Zatom‑1 обучают одновременно на двух доменах — молекулах и материалах, а не на чём‑то одном;
  • она решает и генеративные, и предсказательные задачи, а не только «рисует» структуры или только считает свойства.

Zatom‑1 — это Transformer, который учится сразу на двух типах данных:

  • дискретные типы атомов (C, O, Si, металлы и так далее);
  • непрерывные 3D‑координаты этих атомов.

Модель тренируют с помощью цели под названием multimodal flow matching. За счёт этого:

  • качество масштабируется предсказуемо: чем больше модель, тем лучше результаты на задачах генерации и предсказания;
  • выборка новых структур идёт быстро и стабильно.

На бенчмарках Zatom‑1:

  • достигает или превосходит специализированные модели как в генерации, так и в предсказании свойств;
  • сокращает время генеративного вывода более чем на порядок по сравнению с существующими решениями.

Ещё один важный результат: если во время предобучения модель видит и материалы, и молекулы, то потом она лучше предсказывает молекулярные свойства. То есть материалы помогают «прокачать» предсказания для органики.

Как это работает

Под капотом у Zatom‑1 — Transformer, который одновременно моделирует два пространства:

  • дискретное пространство типов атомов;
  • непрерывное пространство 3D‑геометрии.

Для обучения используют multimodal flow matching. Идея в том, чтобы научить модель плавно «перетекать» от простого распределения к сложному, которое описывает реальные молекулы и материалы.

Что здесь важно технически:

  • один и тот же Transformer обрабатывает и химический состав, и координаты атомов;
  • модель учится по единой цели, где генерация и предсказание связаны между собой;
  • генеративное предобучение используют как универсальную инициализацию для дальнейшего обучения на задачах предсказания свойств, энергий и сил.

За счёт такой схемы Zatom‑1 можно дообучать под конкретные задачи:

  • многоцелевой регрессии свойств (band gap, растворимость, токсичность и так далее);
  • предсказания энергий конфигураций;
  • расчёта сил на атомах для динамики.

Что это значит для вас

Если вы работаете с химией или материалами, Zatom‑1 даёт несколько практических сценариев.

Где модель полезна:

  • Поиск новых молекул и материалов. Быстрая генерация 3D‑кандидатов с заданным составом или свойствами. Это ускоряет ранний этап скрининга.
  • Предсказание свойств. Многоцелевые модели на базе Zatom‑1 могут сразу выдавать набор характеристик для молекул и кристаллов. Подходит для задач в фармацевтике, каталитике, материаловедении.
  • Ускорение расчётов. Предсказания энергий и сил могут частично заменить дорогие DFT‑расчёты на этапе предварительного отбора структур.
  • Кросс‑доменные проекты. Если вы одновременно занимаетесь органикой и неорганическими материалами, одна и та же модель способна обслуживать оба стека задач.

Где лучше не рассчитывать только на Zatom‑1:

  • Регуляторно критичные решения. Для финальных выводов в медицине, токсикологии, безопасности нужна валидация квантовой химией и экспериментом.
  • Узкие ниши с редкими элементами или экзотическими условиями. Если таких данных мало в предобучении, качество предсказаний может просесть.
  • Простые QSAR‑модели. Для задач, где не нужна 3D‑геометрия, иногда дешевле и быстрее использовать классические 2D‑подходы.

Сам по себе arXiv — это только статья. Готового облачного сервиса «в один клик» авторы не дают. Чтобы реально использовать Zatom‑1, вам понадобится команда, которая умеет работать с PyTorch/JAX, HPC и химическими датасетами. Ограничений по странам у препринта нет, VPN не нужен, но готовых коммерческих API на момент публикации статьи авторы не заявляют.

Место на рынке

Zatom‑1 конкурирует не с GPT‑5 или Claude 4, а с узкоспециализированными моделями для 3D‑химии:

  • генеративные модели для молекул (diffusion‑подходы, flow‑модели);
  • графовые нейросети для предсказания свойств и сил (типа SchNet, DimeNet и их наследников);
  • отдельные модели для кристаллических материалов.

По данным авторов, Zatom‑1:

  • по качеству генерации и предсказаний как минимум не уступает специализированным моделям, а часто их превосходит на стандартных бенчмарках;
  • выигрывает по скорости генерации более чем в 10 раз по сравнению с существующими генеративными подходами.

Чего не хватает для полноценного сравнения:

  • авторы не приводят прямых цифр по размеру модели, объёму датасета и стоимости обучения;
  • нет head‑to‑head сравнения по цене вывода с конкретными промышленными системами.

Если вы уже используете отдельные модели для молекул и материалов, Zatom‑1 интересен как единый базовый слой, который можно дообучать под свои датасеты. Если вы только начинаете автоматизировать R&D, стоит смотреть, появится ли на базе Zatom‑1 коммерческий сервис или открытая реализация — без этого входной порог останется высоким.

🔗 Источник: https://arxiv.org/abs/2602.22251
Zatom‑1: базовая ИИ‑модель, которая одновременно генерирует и предсказывает свойства 3D‑молекул и материалов — VogueTech | VogueTech