- Дата публикации
OpenAI прокачала GPT‑Rosalind для биомедицины: больше химии, геномики и реального «мокрого» лаба
Что нового
OpenAI обновила линейку GPT‑Rosalind — это семейство моделей, заточенных под задачи наук о жизни на уровне крупных фармкомпаний и исследовательских центров. Ключевые изменения:
- Новый «движок»: GPT‑Rosalind теперь использует агентные возможности GPT‑5.5 — умение писать код, вызывать инструменты и строить длинные, разветвлённые пайплайны анализа.
- Усиление в ядре фармы: модель стала заметно сильнее в областях, критичных для разработки лекарств:
- медико‑химия (medicinal chemistry);
- геномика и количественная биология;
- анализ и отладка экспериментов «мокрого» лабораторного цикла.
- LifeSciBench — собственный бенчмарк OpenAI для задач биомедицины. Он покрывает шесть типов реальных научных рабочих процессов:
- работа с доказательствами (литература, данные, фигуры, таблицы);
- анализ;
- дизайн и оптимизация (молекулы, эксперименты);
- научное рассуждение;
- валидация и операционные вопросы (дизайн исследований, регуляторика);
- перевод науки в практику и коммуникация. GPT‑Rosalind показывает лучшие результаты среди протестированных моделей на этих задачах (конкретные проценты OpenAI не раскрывает, но подчёркивает лидерство относительно GPT‑5.5 и других внутренних бенчмарков).
- MedChemBench (медико‑химия):
- GPT‑Rosalind: 27,5%;
- GPT‑5.5: 25,1%;
- при этом GPT‑Rosalind расходует на 7,2% меньше токенов на задачу.
- GeneBench (геномика и количественная биология):
- GPT‑Rosalind: 21,6% точности;
- GPT‑5.5: 20,4%;
- токенов уходит на 31% меньше, чем у GPT‑5.5.
- LabWorkBench (поддержка «мокрого» лаба):
- GPT‑Rosalind: 63,2%;
- GPT‑5.5: 55,8%;
- при этом токенов требуется на 5,3% меньше.
- Интеграция с Codex (рабочее пространство OpenAI для научных задач):
- два плагина для бионаук: Life Sciences Research и Life Sciences NGS Analysis;
- новые интерактивные вьюеры для биологических форматов: последовательности, выравнивания, структуры.
- Доступ:
- GPT‑Rosalind доступен в формате research preview для «доверенных» организаций по всему миру;
- появился управляемый workspace OpenAI для тех, у кого нет Enterprise‑аккаунта.
Важно: OpenAI позиционирует GPT‑Rosalind как инструмент для организаций, а не для одиночных пользователей. Речь о фарме, биотехе, крупных академических центрах и институтах общественного здравоохранения.
Как это работает
Базовая архитектура и «агентность»
GPT‑Rosalind строится на архитектуре GPT‑5.5, но с дообучением и настройкой на биомедицину. Главное отличие от «общих» моделей — не просто знание терминов, а способность вести длинные научные рабочие процессы:
- модель разбивает задачу на этапы: поиск литературы, QC данных, статистический анализ, моделирование, проверка гипотез;
- сама решает, когда вызвать внешний инструмент: пайплайн NGS‑анализа, библиотеки для статистики, структурного моделирования, визуализации;
- может возвращаться к промежуточным шагам, корректировать параметры и повторять анализ.
По сути, это не просто чат‑бот, а агент, который строит и исполняет пайплайн. Внутри OpenAI оценивает это через бенчмарки GeneBench и LabWorkBench — там модель должна:
- спланировать анализ по описанию задачи;
- проверить качество данных (QC);
- выбрать метод моделирования;
- интерпретировать результаты с учётом биологического контекста;
- исправить ошибки и пересчитать.
LifeSciBench: как измеряют «научность»
LifeSciBench — это набор задач, который собирает реальные сценарии от биологов и фарм‑исследователей. Важные особенности:
- оценка экспертами: ответы моделей проверяют внешние специалисты, а не только автоматические метрики;
- сквозной подход: задачи не ограничиваются «ответом на один вопрос». Модель должна:
- извлечь данные из статьи, таблицы, графика;
- сопоставить противоречивые источники;
- спроектировать эксперимент или предложить дизайн исследования;
- оценить регуляторные риски и валидность суррогатных конечных точек;
- объяснить выводы понятным научным языком.
Пример из блога OpenAI — оценка пакета данных по микродистрофину для ускоренного одобрения FDA при Дюшеновской мышечной дистрофии. GPT‑Rosalind должна:
- разобрать Western blot и IF‑данные;
- понять, почему антитело MANEX1A не различает эндогенный и терапевтический дистрофин;
- заметить, что использовать полный дистрофин как стандарт для 138‑кДа микродистрофина некорректно;
- связать это с валидностью суррогатной конечной точки;
- оценить дизайн биопсий, статистику по NSAA, возрастные конфаундеры;
- сформулировать регуляторный вывод.
Модель не просто «пересказывает» статью, а критикует пакет как это сделал бы регуляторный эксперт. В рубрике оценки учитывают, насколько полно GPT‑Rosalind:
- видит проблемы измерений;
- отделяет биомаркер от клинической пользы;
- учитывает дизайн исследования и статистику;
- анализирует иммунные и долговременные риски AAV‑терапии;
- видит ограничения по выборке и обобщаемости.
MedChemBench: химия как рабочий процесс
В медико‑химии GPT‑Rosalind тестируют на задачах, которые ближе к реальной работе проектной команды, чем классические «игрушечные» бенчмарки:
- понимание химических структур (включая изображения и нотации);
- анализ SAR (structure–activity relationship);
- прогноз:
- потенции;
- токсичности;
- ADME‑профиля (absorption, distribution, metabolism, excretion);
- многопараметрическая оптимизация лидов — баланс эффективности, безопасности, PK и синтетической доступности;
- ретросинтез.
Результат: GPT‑Rosalind 27,5% против 25,1% у GPT‑5.5 на MedChemBench при 7,2% экономии токенов. То есть модель не только чаще права, но и дешевле в использовании при тех же задачах.
GeneBench и LabWorkBench: длинные цепочки решений
GeneBench проверяет модель на длинных задачах в:
- функциональной геномике;
- пространственной транскриптомике;
- протеомике;
- эпигеномике;
- прикладной генетике.
Требование — от сырых или полуготовых данных перейти к решению, важному для принятия решения (например, выбор таргета или гипотезы). GPT‑Rosalind показывает 21,6% точности против 20,4% у GPT‑5.5 и тратит на 31% меньше токенов.
LabWorkBench — это уже чистый «мокрый» лаб:
- реальные протоколы, используемые учёными;
- задачи: отладка, оптимизация, интерпретация результатов;
- данные — проприетарные, чтобы исключить утечку в обучение.
Здесь GPT‑Rosalind даёт 63,2% против 55,8% у GPT‑5.5 и использует на 5,3% меньше токенов.
Плагины и Codex: как всё связывается
OpenAI завела вокруг GPT‑Rosalind рабочее пространство Codex с плагинами:
- Life Sciences Research
- поиск и извлечение доказательств из литературы;
- интерпретация биологических данных;
- связывание внешних источников с внутренними результатами.
- Life Sciences NGS Analysis
- запуск пайплайнов для NGS прямо из диалога:
- scRNA‑seq QC и аннотация;
- bulk RNA‑seq QC и подсчёты;
- ведение «аудируемых» конвертов с результатами, параметрами и caveats.
- запуск пайплайнов для NGS прямо из диалога:
Примеры из блога OpenAI:
- scRNA‑seq QC & Annotation:
- вы отдаёте 10x‑подобный матричный бандл;
- плагин
scrna-seq-qcвыбирает пороги QC из данных; - формирует артефакты single‑cell, аннотации и UMAP‑проекции;
- сохраняет происхождение всех шагов и показывает, где не хватает, например, детекции дублетов.
- Bulk RNA‑seq FASTQ QC:
- на вход: sample sheet, FASTQ‑файлы и референсы;
- на выход: проверенный QC‑counts‑бандл, который можно дальше использовать в Codex;
- в комплекте: MultiQC, матрицы Salmon, provenance и явные caveats.
Поверх этого работают интерактивные вьюеры:
- последовательности и выравнивания (для геномики и транскриптомики);
- структуры белков и комплексов (для медико‑химии и таргетного дизайна).
В демонстрации из блога GPT‑Rosalind:
- анализирует жидкостную биопсию опухоли;
- через NGS‑плагин превращает ctDNA‑записи в интерактивный ноутбук;
- находит повторяющиеся и низкочастотные мутации, выделяет траектории образцов;
- фокусируется на KRAS G12C;
- через Life Sciences Research подтягивает данные по таргету, ингибиторам и резистентности;
- через вьюеры даёт посмотреть остаток 12, его консервацию в семействе RAS и карман связывания ингибитора;
- завершает всё списком возможных дальнейших шагов с артефактами для экспертного ревью.
Что это значит для вас
Кому это реально нужно
GPT‑Rosalind — продукт для тех, кто профессионально занимается биомедицинскими исследованиями:
- фармкомпании и биотех‑стартапы (дискавери, ранняя разработка, таргетная валидация);
- академические лаборатории в областях:
- молекулярная биология;
- геномика и транскриптомика;
- системная биология;
- структурная биология и медико‑химия;
- клинические исследовательские центры и регуляторные команды;
- организации в сфере общественного здравоохранения, preparedness и biodefense.
Если вы просто хотите «поболтать с ИИ про биологию» — GPT‑Rosalind избыточен. Для этого подойдут обычные модели вроде GPT‑5 или GPT‑4o.
Практические сценарии, где GPT‑Rosalind силён
-
Разбор сложных статей и досье
- вытаскивает данные из текста, таблиц, фигур;
- сопоставляет конфликтующие результаты;
- формирует структурированное резюме по таргету, молекуле, биомаркеру;
- может критически разобрать доказательную базу, как в кейсе с микродистрофином и FDA.
-
Медико‑химия и дизайн молекул
- анализ SAR и предложение направлений оптимизации;
- оценка рисков по токсичности и ADME на основе структуры и литературы;
- предложения по ретросинтезу и синтетической доступности.
-
NGS‑аналитика «под ключ» (через Life Sciences NGS Analysis)
- scRNA‑seq: QC, фильтрация, кластеризация, аннотация, UMAP;
- bulk RNA‑seq: QC, маппинг/квази‑маппинг, подсчёты, отчёты (MultiQC, Salmon);
- сохранение provenance и caveats, что важно для аудита и публикаций.
-
Траблшутинг экспериментов
- разбор протоколов «мокрого» лаба;
- поиск причин, почему эксперимент «упал» (буферы, температуры, шаги инкубации);
- предложения по оптимизации дизайна.
-
Подготовка к регуляторным дискуссиям
- оценка валидности суррогатных конечных точек;
- анализ дизайна клинических исследований, выбор компараторов, статистика;
- выявление конфаундеров (возрастные окна, выбор биопсий, внешние когорты).
-
Интеграция multi‑omics
- связывание литературы, геномики, транскриптомики, протеомики и структурных данных;
- помощь в формировании гипотез о механизмах действия и резистентности.
Где GPT‑Rosalind использовать не стоит
- Как единственный источник истины. Модель по‑прежнему может ошибаться, «галлюцинировать» ссылки или неправильно интерпретировать редкие кейсы.
- Для принятия клинических решений в одиночку. GPT‑Rosalind не заменяет врача, регулятора или safety‑комитет.
- Для задач вне биомедицины. Для обычной аналитики, маркетинга, кода или дизайна дешевле и логичнее использовать GPT‑5, GPT‑4o или другие универсальные модели.
- Если у вас нет процессов контроля качества. Модель рассчитана на команды, которые умеют проверять выводы, воспроизводить анализ и документировать решения.
Вопрос доступа и Россия
OpenAI даёт доступ к GPT‑Rosalind через trusted‑access:
- нужна организация, которая занимается легитимными научными исследованиями с общественной пользой;
- требуется сильный внутренний комплаенс и контроль за использованием;
- доступ идёт через Enterprise‑уровень или управляемый workspace.
Для российских организаций доступ осложняют:
- юридические и санкционные ограничения;
- требования OpenAI к «доверенным» организациям и безопасности.
На практике это значит:
- частному пользователю из России напрямую воспользоваться GPT‑Rosalind почти нереально;
- крупным международным компаниям с R&D‑центрами (включая те, у кого есть российские команды) проще получить доступ через головные офисы;
- VPN сам по себе проблему не решает: нужен одобренный организационный доступ.
Если вы работаете в российской лаборатории или биотехе, реальный путь —
- сотрудничество с международными центрами, у которых уже есть доступ к OpenAI Enterprise и GPT‑Rosalind;
- участие в совместных проектах, где инфраструктура и доступом управляет партнёр.
Место на рынке
Сравнивать GPT‑Rosalind имеет смысл с тремя классами решений:
- Универсальные LLM (GPT‑5, GPT‑4o и аналоги);
- Специализированные биомедицинские модели (BioGPT‑подобные, но без конкретных цифр из блога их трогать не будем);
- Классические инструменты NGS и медико‑химии (Seurat, Scanpy, GATK, RDKit, коммерческие платформы).
Против GPT‑5 и GPT‑4o
По данным OpenAI:
- GPT‑Rosalind лучше GPT‑5.5 на MedChemBench (27,5% против 25,1%), GeneBench (21,6% против 20,4%) и LabWorkBench (63,2% против 55,8%);
- при этом экономит токены: −7,2% на MedChemBench, −31% на GeneBench, −5,3% на LabWorkBench.
Если вы уже платите за GPT‑5.5 и используете его для биомедицины, переход на GPT‑Rosalind даст:
- более точные ответы на профильных задачах;
- меньший расход токенов на те же сценарии;
- доступ к специализированным плагинам и вьюерам через Codex.
О цене OpenAI в блоге не говорит, но логика простая:
- GPT‑Rosalind идёт как enterprise‑продукт с trusted‑access;
- можно ожидать, что он дороже массовых моделей уровня GPT‑4o, но даёт выигрыш по стоимости владения за счёт меньшего числа ошибок и меньшего расхода токенов в реальных пайплайнах.
Против классических bio/chem‑инструментов
GPT‑Rosalind не заменяет Seurat, Scanpy, GATK, RDKit или коммерческие платформы NGS‑аналитики. Он выступает надстройкой‑оркестратором:
- помогает выбрать подходящий инструмент и параметры;
- пишет и правит код анализа;
- интерпретирует результаты и связывает их с литературой.
Плюсы GPT‑Rosalind по сравнению с чисто инструментальными стеками:
- умеет объяснять и обосновывать решения человеческим языком;
- видит контекст: регуляторный, клинический, биологический;
- может быстро собрать «черновой» пайплайн для новой задачи.
Минусы:
- без доменной экспертизы команды его выводы опасно воспринимать как окончательные;
- для тяжёлых вычислений (выравнивание, крупные симуляции) всё равно нужны специализированные движки — GPT‑Rosalind лишь управляет ими.
Кейсы партнёров: Novo Nordisk
OpenAI отдельно подчёркивает партнёрство с Novo Nordisk. Компания использует GPT‑Rosalind для:
- масштабирования медицинских исследований;
- анализа сложных датасетов;
- поиска закономерностей и проверки гипотез;
- связывания литературы, геномики, транскриптомики, структур и экспериментальных данных.
Комментарий от Novo Nordisk: AI для биомедицины должен быть
- привязан к доверенным научным данным;
- подключён к валидированным инструментам;
- встроен в реальные рабочие процессы исследователей.
GPT‑Rosalind как раз строится вокруг этой идеи: не просто «умная модель», а часть инфраструктуры R&D.
Что дальше
OpenAI явно не рассматривает GPT‑Rosalind как разовый релиз. В планах:
- дальнейшее усиление биологического и регуляторного рассуждения;
- поддержка ещё более длинных и инструментально насыщенных рабочих процессов;
- работа с организациями из разных регионов для оценки реального эффекта.
Фокус — не только на drug discovery, но и на задачах общественного здравоохранения и безопасности:
- трансляционная медицина;
- public health и preparedness;
- biodefense через программу Rosalind Biodefense и доверенную модель деплоймента.
Стратегическая цель OpenAI: превратить GPT‑Rosalind в полноценного партнёра исследователя по всему циклу разработки лекарств — от постановки вопроса до дизайна эксперимента, анализа данных и подготовки материалов для регуляторов и публикаций.
Если вы работаете в биомедицине и думаете, стоит ли обращать внимание на GPT‑Rosalind, ответ простой:
- если у вас есть инфраструктура, комплаенс и доступ к OpenAI Enterprise — это один из самых продвинутых инструментов для научных рабочих процессов;
- если вы пока на уровне отдельных ноутбуков и скриптов — имеет смысл следить за развитием, но не ждать, что GPT‑Rosalind заменит команду bioinformaticians завтра.