ИИ-врач без облака: как локальный агент на 30 млрд параметров прошёл 100% клинических задач — VogueTech

Что открыли

Исследователи предложили способ «прокачать» локальные медицинские ИИ-агенты без дообучения и без слива данных в облако.

Они разработали State-Enhanced Logical-Skill Memory (SELSM) — надстройку над большими языковыми моделями на 30–32 млрд параметров. SELSM не меняет веса модели, а добавляет ей внешнюю «память» с логическими правилами. Эти правила не завязаны на конкретных пациентах, а описывают обобщённые шаги: что и в каком порядке делать в электронной медкарте.

Команда протестировала SELSM на MedAgentBench — это виртуальная среда с электронными медицинскими картами (EHR) на основе стандарта FHIR и реальных клинических данных. Там ИИ-агенту нужно пошагово выполнять клинические задачи: искать информацию, обновлять записи, оформлять назначения.

На модели Qwen3-30B-A3B SELSM убрал все «обрывы цепочки задач» — агент стал завершать 100% сценариев. Общий успех выполнения задач вырос на 22,67 процентных пункта. По сравнению с другими подходами с памятью SELSM показал заметно более высокие результаты.

Как исследовали

Команда работала с MedAgentBench — это сейчас единственный «песочничный» бенчмарк такого уровня для медицинских агентов, основанный на реальных клинических EHR-данных и стандарте FHIR.

Исследователи сначала сымитировали множество клинических сценариев и записали траектории работы агента: какие шаги он делает, в каком состоянии системы, к чему это приводит. Эти траектории они перегнали в абстрактное пространство навыков: без имён пациентов, диагнозов и прочих конкретных сущностей.

SELSM хранит эти навыки как набор логических правил. Во время работы агент не «вспоминает» конкретный случай, а вытаскивает из памяти подходящий набор шагов для текущего состояния системы.

Для этого авторы придумали двухэтапный механизм поиска — Query-Anchored Two-Stage Retrieval. Сначала он подбирает кандидатов по текстовому запросу, потом уточняет выбор с учётом текущего состояния EHR. Это помогает решить проблему «многозначных состояний», когда одно и то же текстовое описание ситуации может требовать разных действий.

Тестировали SELSM на локально запускаемых больших моделях с 30–32 млрд параметров. Ключевой пример — Qwen3-30B-A3B, на которой и достигли 100% завершения цепочек задач.

Что это меняет на практике

Главный эффект — медицинский ИИ-агент можно запускать прямо в инфраструктуре клиники, без пересылки данных наружу и без тяжёлого дообучения. SELSM работает как надстройка: он не требует менять веса базовой модели и не ломает существующие процессы.

Для больниц и разработчиков медицинских ИТ это два бонуса:

Конфиденциальность. Навыки хранятся в виде абстрактных правил, а не в виде сырых медицинских данных. Это сильно упрощает соответствие регуляторным требованиям.
Стоимость. Не нужно каждый раз обучать модель на локальных данных. Достаточно один раз собрать и обновлять «логическую память».

На практике это может означать более надёжных агентов для работы с FHIR-совместимыми EHR-системами: меньше «зависших» задач, меньше ручной доработки со стороны персонала.

Пока SELSM проверили только на взаимодействиях с электронными медкартами в формате FHIR. Но архитектура, не завязанная на конкретные сущности, позволяет перенести подход на другие клинические сценарии — от маршрутизации пациентов до поддержки принятия решений.

Что это значит для вас

Если вы работаете в цифровой медицине, разрабатываете EHR или пилотируете ИИ-агентов в клинике, работа напрямую с пациентскими данными — главный стоп-фактор. SELSM предлагает путь, где логика работы агента обучается на симуляциях, а не на живых данных.

Это особенно интересно, если вы тестируете или планируете локальные модели масштаба 30–32B параметров, например Qwen3-30B-A3B. Исследование показывает, что даже без дообучения на ваших данных можно заметно поднять качество выполнения задач и добиться 100% завершения цепочек сценариев в бенчмарке уровня MedAgentBench.

Если вы — врач или администратор клиники, для вас это сигнал: локальные ИИ-агенты становятся ближе к тому, чтобы безопасно автоматизировать рутину в EHR-системах. Но это пока исследовательский результат, а не готовый продукт. До интеграции в реальные рабочие места ещё нужен путь через сертификацию, валидацию на конкретных локальных данных и проверку на устойчивость к редким клиническим случаям.

Для обычного пользователя медицинских сервисов прямого эффекта сегодня нет. Но по мере внедрения таких систем вы можете ожидать более аккуратную работу цифровых ассистентов: меньше потерянных записей, меньше ошибок при работе с электронной картой и, потенциально, более быструю обработку запросов в клиниках и страховых сервисах.

Что открыли

Как исследовали

Что это меняет на практике

Что это значит для вас

Читайте также