Дата публикации
business

ИИ-агент на медпульте: как Совкомбанк превратил LLM в «третью руку» оператора

Что произошло

Совкомбанк Технологии вместе со Страховой Группой Совкомбанка за несколько недель ИИ-марафона собрали рабочий сервис для медицинского пульта страховой компании.

Ключевые факты:

  • формат: внутренний ИИ-марафон Совкомбанка (по сути — корпоративный хакатон с обязательным рабочим прототипом, а не только презентацией);
  • команда: аналитик, backend-разработчики, специалист по интеграциям, ML/LLM-инженеры, тестировщики и бизнес-заказчики;
  • цель: автоматизировать ввод данных по звонкам на медпульт и встроить LLM в живой процесс с высокой ценой ошибки;
  • нагрузка целевого контура: до 57 одновременных звонков;
  • длительность одного звонка: около 3 минут, плюс до 3 минут постобработки;
  • стек первой версии: Streamlit для интерфейса, FastAPI для backend, VoiceKey для распознавания речи, Qwen3‑30B в роли LLM;
  • контур эксплуатации: закрытая инфраструктура банка, работа с медицинскими данными.

ИИ-агент не общается с клиентом напрямую и не ставит диагнозы. Он слушает расшифровку разговора, собирает из неё структурированный черновик обращения: ФИО, причину звонка, симптомы, предполагаемый диагноз и возможный код МКБ. Оператор видит этот черновик и сам принимает финальные решения.

Зачем это нужно

Медицинский пульт страховой компании — не просто кол-центр. Оператор одновременно:

  • разговаривает с человеком, который часто находится в стрессе;
  • уточняет симптомы и детали ситуации;
  • ищет данные в нескольких системах;
  • фиксирует жалобы, диагноз, услуги, договор;
  • заполняет CRM и другие формы.

При этом звонки в пике идут почти без пауз. У оператора на всё — несколько минут. Команда проекта пошла к пользователям и увидела главную боль: оператор физически не успевает печатать с той скоростью, с которой говорит клиент.

Отсюда родилась идея «третьей руки» — ИИ, который:

  • сам «слушает» расшифровку звонка;
  • вытаскивает оттуда ключевые данные;
  • заполняет черновик карточки обращения в CRM;
  • предлагает код МКБ, если это уместно;
  • оставляет человеку право на финальную правку.

Для Совкомбанк Технологий это способ проверить, можно ли безопасно встроить LLM в процесс, где ошибка бьёт по людям и по репутации. Для страхового бизнеса — шанс сократить время на рутину, разгрузить операторов и повысить качество данных в системе.

Важно, что команда изначально отказалась от идеи «ИИ вместо оператора». Стратегия ровно обратная: ИИ снимает рутину, а человек остаётся центром принятия решений.

Что меняет для рынка

От «игры с нейросетью» к рабочему контуру

Большинство быстрых экспериментов с LLM в страховании и медицине заканчиваются на красивом демо. Здесь команда прошла путь от прототипа к архитектуре, которую можно встраивать в реальные процессы.

Два этапа разработки:

  1. Быстрый прототип

    • Streamlit — простой веб-интерфейс без отдельной frontend-команды.
    • FastAPI — лёгкий backend для приёма аудио и выдачи результата.
    • VoiceKey — сервис распознавания речи для расшифровки звонка.
    • Qwen3‑30B — LLM, которая не «советует», а структурирует.

    Оператор загружал запись и через несколько секунд видел:

    • ФИО клиента;
    • причину обращения;
    • описанные симптомы;
    • предполагаемый диагноз;
    • предложенный код МКБ.

    Это доказало жизнеспособность сценария: из сырой расшифровки можно быстро получить удобный черновик.

  2. Переход к рабочему сценарию

    Когда стало ясно, что идея работает, команда переключилась на:

    • интеграцию с телефонией: связка SmartLogger и Avaya стала источником аудио, идентификаторов звонков и служебных метаданных;
    • управление очередями и состоянием: Redis хранит промежуточные данные и помогает устойчиво обрабатывать до 57 параллельных звонков;
    • безопасность: весь контур — внутри инфраструктуры банка, без вывода медицинских данных наружу; настроена авторизация, разграничение прав и аудит действий.

Для рынка это сигнал: LLM уже можно использовать не только в чат-ботах и маркетинге, но и в процессах с медицинским контекстом — если чётко ограничить роль модели и выстроить архитектуру вокруг неё.

Как работать с LLM, когда ошибаться нельзя

Команда выбрала Qwen3‑30B не как «медицинского эксперта», а как инструмент структурирования текста. Модель не ставит диагнозы и не спорит с врачами. Её задача — из длинной русскоязычной транскрибации вытащить факты и аккуратно разложить их по полям.

Ключевые решения, которые важны для любого игрока рынка, работающего с LLM в чувствительных сценариях:

  • Температура 0.1. Команда сознательно «задушила» креативность модели. Нужна не фантазия, а повторяемость: один и тот же текст должен давать максимально похожий результат.

  • Жёсткий системный промпт. В промпте подробно описали:

    • роль модели (ассистент по структурированию данных);
    • формат ответа (JSON-подобная структура);
    • правило: если в расшифровке нет данных, модель пишет «Не указано», а не угадывает.
  • JSON-подобный ответ. LLM сразу возвращает структуру, которую backend может валидировать и безопасно прокинуть дальше в CRM.

  • Негативные примеры в промптах. Команда явно описала, чего делать нельзя:

    • не выдумывать ФИО;
    • не подменять жалобу диагнозом;
    • не ставить код МКБ по одному слову без контекста;
    • не заполнять поля тем, чего нет в разговоре.

Базовое правило проекта — «если данных нет в разговоре, не придумываем». Это прямой ответ на главный страх рынка: LLM, которая уверенно выдумывает медицинские факты.

Плюсы и минусы подхода

Что хорошо:

  • оператор не отвлекается от живого общения с человеком, а рутину берёт на себя ИИ;
  • снижается время постобработки звонка — черновик уже готов, остаётся проверить и поправить;
  • повышается качество данных в CRM: меньше пропусков и случайных ошибок из-за спешки;
  • LLM работает в закрытом контуре и не уносит медицинскую информацию наружу;
  • архитектура учитывает реальную нагрузку — до 57 параллельных звонков.

Что сложно и кому может не подойти:

  • сценарий требует интеграции с телефонией и CRM, без доступа к этим системам эффект будет слабее;
  • нужна команда, которая умеет не только настраивать LLM, но и строить над ней устойчивый сервис;
  • медицинский контекст накладывает жёсткие требования к промптам и проверкам, это не «быстрый чат-бот за выходные».

Для игроков рынка, которые хотят «заменить людей ИИ», этот кейс не про то. Он про осторожное внедрение LLM в критичные процессы, где человек остаётся ответственным.

Что это значит для вас

Если вы работаете в страховой медицине или кол-центре

Этот кейс показывает, что ИИ-агент уже может стать частью команды, а не внешним виджетом:

  • можно сократить время обработки звонков без потери качества сервиса;
  • можно уменьшить нагрузку на операторов в пиковые часы;
  • можно аккуратно использовать LLM, не передавая данные наружу.

Но придётся инвестировать в архитектуру: интеграции с телефонией, очереди, хранение состояния и контроль доступа.

Если вы строите продукты на базе LLM

Из этого проекта можно забрать несколько практических уроков:

  • не пытайтесь сделать из LLM врача или независимого эксперта там, где цена ошибки высока;
  • начинайте с роли «структуризатор текста» и добавляйте ответственность очень дозировано;
  • жёстко задавайте формат ответа и поведение на отсутствие данных;
  • снижайте температуру и добавляйте негативные примеры в промпты, если важна предсказуемость;
  • думайте не только о модели, но и о контуре вокруг неё: очереди, сессии, безопасность.

Если вы пользователь страховых сервисов

Непрямой, но важный эффект: такие решения повышают шанс, что оператор не пропустит важную деталь из вашего рассказа и не перепутает данные в спешке.

ИИ не решит за вас медицинские вопросы. Но он может помочь оператору быстрее и точнее оформить ваше обращение, пока вы разговариваете с живым человеком, а не с роботом.


Читайте также