- Дата публикации
ИИ-врач без облака: как локальный агент на 30 млрд параметров прошёл 100% клинических задач
Что открыли
Исследователи предложили способ «прокачать» локальные медицинские ИИ-агенты без дообучения и без слива данных в облако.
Они разработали State-Enhanced Logical-Skill Memory (SELSM) — надстройку над большими языковыми моделями на 30–32 млрд параметров. SELSM не меняет веса модели, а добавляет ей внешнюю «память» с логическими правилами. Эти правила не завязаны на конкретных пациентах, а описывают обобщённые шаги: что и в каком порядке делать в электронной медкарте.
Команда протестировала SELSM на MedAgentBench — это виртуальная среда с электронными медицинскими картами (EHR) на основе стандарта FHIR и реальных клинических данных. Там ИИ-агенту нужно пошагово выполнять клинические задачи: искать информацию, обновлять записи, оформлять назначения.
На модели Qwen3-30B-A3B SELSM убрал все «обрывы цепочки задач» — агент стал завершать 100% сценариев. Общий успех выполнения задач вырос на 22,67 процентных пункта. По сравнению с другими подходами с памятью SELSM показал заметно более высокие результаты.
Как исследовали
Команда работала с MedAgentBench — это сейчас единственный «песочничный» бенчмарк такого уровня для медицинских агентов, основанный на реальных клинических EHR-данных и стандарте FHIR.
Исследователи сначала сымитировали множество клинических сценариев и записали траектории работы агента: какие шаги он делает, в каком состоянии системы, к чему это приводит. Эти траектории они перегнали в абстрактное пространство навыков: без имён пациентов, диагнозов и прочих конкретных сущностей.
SELSM хранит эти навыки как набор логических правил. Во время работы агент не «вспоминает» конкретный случай, а вытаскивает из памяти подходящий набор шагов для текущего состояния системы.
Для этого авторы придумали двухэтапный механизм поиска — Query-Anchored Two-Stage Retrieval. Сначала он подбирает кандидатов по текстовому запросу, потом уточняет выбор с учётом текущего состояния EHR. Это помогает решить проблему «многозначных состояний», когда одно и то же текстовое описание ситуации может требовать разных действий.
Тестировали SELSM на локально запускаемых больших моделях с 30–32 млрд параметров. Ключевой пример — Qwen3-30B-A3B, на которой и достигли 100% завершения цепочек задач.
Что это меняет на практике
Главный эффект — медицинский ИИ-агент можно запускать прямо в инфраструктуре клиники, без пересылки данных наружу и без тяжёлого дообучения. SELSM работает как надстройка: он не требует менять веса базовой модели и не ломает существующие процессы.
Для больниц и разработчиков медицинских ИТ это два бонуса:
- Конфиденциальность. Навыки хранятся в виде абстрактных правил, а не в виде сырых медицинских данных. Это сильно упрощает соответствие регуляторным требованиям.
- Стоимость. Не нужно каждый раз обучать модель на локальных данных. Достаточно один раз собрать и обновлять «логическую память».
На практике это может означать более надёжных агентов для работы с FHIR-совместимыми EHR-системами: меньше «зависших» задач, меньше ручной доработки со стороны персонала.
Пока SELSM проверили только на взаимодействиях с электронными медкартами в формате FHIR. Но архитектура, не завязанная на конкретные сущности, позволяет перенести подход на другие клинические сценарии — от маршрутизации пациентов до поддержки принятия решений.
Что это значит для вас
Если вы работаете в цифровой медицине, разрабатываете EHR или пилотируете ИИ-агентов в клинике, работа напрямую с пациентскими данными — главный стоп-фактор. SELSM предлагает путь, где логика работы агента обучается на симуляциях, а не на живых данных.
Это особенно интересно, если вы тестируете или планируете локальные модели масштаба 30–32B параметров, например Qwen3-30B-A3B. Исследование показывает, что даже без дообучения на ваших данных можно заметно поднять качество выполнения задач и добиться 100% завершения цепочек сценариев в бенчмарке уровня MedAgentBench.
Если вы — врач или администратор клиники, для вас это сигнал: локальные ИИ-агенты становятся ближе к тому, чтобы безопасно автоматизировать рутину в EHR-системах. Но это пока исследовательский результат, а не готовый продукт. До интеграции в реальные рабочие места ещё нужен путь через сертификацию, валидацию на конкретных локальных данных и проверку на устойчивость к редким клиническим случаям.
Для обычного пользователя медицинских сервисов прямого эффекта сегодня нет. Но по мере внедрения таких систем вы можете ожидать более аккуратную работу цифровых ассистентов: меньше потерянных записей, меньше ошибок при работе с электронной картой и, потенциально, более быструю обработку запросов в клиниках и страховых сервисах.