- Дата публикации
Zatom‑1: базовая ИИ‑модель, которая одновременно генерирует и предсказывает свойства 3D‑молекул и материалов
Что появилось / что изменилось
Исследователи представили Zatom‑1 — базовую модель для 3D‑химии, которая работает сразу с двумя задачами:
- генерирует новые молекулы и кристаллические материалы в 3D;
- предсказывает их свойства, энергии и силы на атомах.
Главное отличие от большинства существующих подходов:
- Zatom‑1 обучают одновременно на двух доменах — молекулах и материалах, а не на чём‑то одном;
- она решает и генеративные, и предсказательные задачи, а не только «рисует» структуры или только считает свойства.
Zatom‑1 — это Transformer, который учится сразу на двух типах данных:
- дискретные типы атомов (C, O, Si, металлы и так далее);
- непрерывные 3D‑координаты этих атомов.
Модель тренируют с помощью цели под названием multimodal flow matching. За счёт этого:
- качество масштабируется предсказуемо: чем больше модель, тем лучше результаты на задачах генерации и предсказания;
- выборка новых структур идёт быстро и стабильно.
На бенчмарках Zatom‑1:
- достигает или превосходит специализированные модели как в генерации, так и в предсказании свойств;
- сокращает время генеративного вывода более чем на порядок по сравнению с существующими решениями.
Ещё один важный результат: если во время предобучения модель видит и материалы, и молекулы, то потом она лучше предсказывает молекулярные свойства. То есть материалы помогают «прокачать» предсказания для органики.
Как это работает
Под капотом у Zatom‑1 — Transformer, который одновременно моделирует два пространства:
- дискретное пространство типов атомов;
- непрерывное пространство 3D‑геометрии.
Для обучения используют multimodal flow matching. Идея в том, чтобы научить модель плавно «перетекать» от простого распределения к сложному, которое описывает реальные молекулы и материалы.
Что здесь важно технически:
- один и тот же Transformer обрабатывает и химический состав, и координаты атомов;
- модель учится по единой цели, где генерация и предсказание связаны между собой;
- генеративное предобучение используют как универсальную инициализацию для дальнейшего обучения на задачах предсказания свойств, энергий и сил.
За счёт такой схемы Zatom‑1 можно дообучать под конкретные задачи:
- многоцелевой регрессии свойств (band gap, растворимость, токсичность и так далее);
- предсказания энергий конфигураций;
- расчёта сил на атомах для динамики.
Что это значит для вас
Если вы работаете с химией или материалами, Zatom‑1 даёт несколько практических сценариев.
Где модель полезна:
- Поиск новых молекул и материалов. Быстрая генерация 3D‑кандидатов с заданным составом или свойствами. Это ускоряет ранний этап скрининга.
- Предсказание свойств. Многоцелевые модели на базе Zatom‑1 могут сразу выдавать набор характеристик для молекул и кристаллов. Подходит для задач в фармацевтике, каталитике, материаловедении.
- Ускорение расчётов. Предсказания энергий и сил могут частично заменить дорогие DFT‑расчёты на этапе предварительного отбора структур.
- Кросс‑доменные проекты. Если вы одновременно занимаетесь органикой и неорганическими материалами, одна и та же модель способна обслуживать оба стека задач.
Где лучше не рассчитывать только на Zatom‑1:
- Регуляторно критичные решения. Для финальных выводов в медицине, токсикологии, безопасности нужна валидация квантовой химией и экспериментом.
- Узкие ниши с редкими элементами или экзотическими условиями. Если таких данных мало в предобучении, качество предсказаний может просесть.
- Простые QSAR‑модели. Для задач, где не нужна 3D‑геометрия, иногда дешевле и быстрее использовать классические 2D‑подходы.
Сам по себе arXiv — это только статья. Готового облачного сервиса «в один клик» авторы не дают. Чтобы реально использовать Zatom‑1, вам понадобится команда, которая умеет работать с PyTorch/JAX, HPC и химическими датасетами. Ограничений по странам у препринта нет, VPN не нужен, но готовых коммерческих API на момент публикации статьи авторы не заявляют.
Место на рынке
Zatom‑1 конкурирует не с GPT‑5 или Claude 4, а с узкоспециализированными моделями для 3D‑химии:
- генеративные модели для молекул (diffusion‑подходы, flow‑модели);
- графовые нейросети для предсказания свойств и сил (типа SchNet, DimeNet и их наследников);
- отдельные модели для кристаллических материалов.
По данным авторов, Zatom‑1:
- по качеству генерации и предсказаний как минимум не уступает специализированным моделям, а часто их превосходит на стандартных бенчмарках;
- выигрывает по скорости генерации более чем в 10 раз по сравнению с существующими генеративными подходами.
Чего не хватает для полноценного сравнения:
- авторы не приводят прямых цифр по размеру модели, объёму датасета и стоимости обучения;
- нет head‑to‑head сравнения по цене вывода с конкретными промышленными системами.
Если вы уже используете отдельные модели для молекул и материалов, Zatom‑1 интересен как единый базовый слой, который можно дообучать под свои датасеты. Если вы только начинаете автоматизировать R&D, стоит смотреть, появится ли на базе Zatom‑1 коммерческий сервис или открытая реализация — без этого входной порог останется высоким.