ИИ-агент на медпульте: как Совкомбанк превратил LLM в «третью руку» оператора — VogueTech

Что произошло

Совкомбанк Технологии вместе со Страховой Группой Совкомбанка за несколько недель ИИ-марафона собрали рабочий сервис для медицинского пульта страховой компании.

Ключевые факты:

формат: внутренний ИИ-марафон Совкомбанка (по сути — корпоративный хакатон с обязательным рабочим прототипом, а не только презентацией);
команда: аналитик, backend-разработчики, специалист по интеграциям, ML/LLM-инженеры, тестировщики и бизнес-заказчики;
цель: автоматизировать ввод данных по звонкам на медпульт и встроить LLM в живой процесс с высокой ценой ошибки;
нагрузка целевого контура: до 57 одновременных звонков;
длительность одного звонка: около 3 минут, плюс до 3 минут постобработки;
стек первой версии: Streamlit для интерфейса, FastAPI для backend, VoiceKey для распознавания речи, Qwen3‑30B в роли LLM;
контур эксплуатации: закрытая инфраструктура банка, работа с медицинскими данными.

ИИ-агент не общается с клиентом напрямую и не ставит диагнозы. Он слушает расшифровку разговора, собирает из неё структурированный черновик обращения: ФИО, причину звонка, симптомы, предполагаемый диагноз и возможный код МКБ. Оператор видит этот черновик и сам принимает финальные решения.

Зачем это нужно

Медицинский пульт страховой компании — не просто кол-центр. Оператор одновременно:

разговаривает с человеком, который часто находится в стрессе;
уточняет симптомы и детали ситуации;
ищет данные в нескольких системах;
фиксирует жалобы, диагноз, услуги, договор;
заполняет CRM и другие формы.

При этом звонки в пике идут почти без пауз. У оператора на всё — несколько минут. Команда проекта пошла к пользователям и увидела главную боль: оператор физически не успевает печатать с той скоростью, с которой говорит клиент.

Отсюда родилась идея «третьей руки» — ИИ, который:

сам «слушает» расшифровку звонка;
вытаскивает оттуда ключевые данные;
заполняет черновик карточки обращения в CRM;
предлагает код МКБ, если это уместно;
оставляет человеку право на финальную правку.

Для Совкомбанк Технологий это способ проверить, можно ли безопасно встроить LLM в процесс, где ошибка бьёт по людям и по репутации. Для страхового бизнеса — шанс сократить время на рутину, разгрузить операторов и повысить качество данных в системе.

Важно, что команда изначально отказалась от идеи «ИИ вместо оператора». Стратегия ровно обратная: ИИ снимает рутину, а человек остаётся центром принятия решений.

Что меняет для рынка

От «игры с нейросетью» к рабочему контуру

Большинство быстрых экспериментов с LLM в страховании и медицине заканчиваются на красивом демо. Здесь команда прошла путь от прототипа к архитектуре, которую можно встраивать в реальные процессы.

Два этапа разработки:

Быстрый прототип
- Streamlit — простой веб-интерфейс без отдельной frontend-команды.
- FastAPI — лёгкий backend для приёма аудио и выдачи результата.
- VoiceKey — сервис распознавания речи для расшифровки звонка.
- Qwen3‑30B — LLM, которая не «советует», а структурирует.
Оператор загружал запись и через несколько секунд видел:
- ФИО клиента;
- причину обращения;
- описанные симптомы;
- предполагаемый диагноз;
- предложенный код МКБ.
Это доказало жизнеспособность сценария: из сырой расшифровки можно быстро получить удобный черновик.
Переход к рабочему сценарию

Когда стало ясно, что идея работает, команда переключилась на:
- интеграцию с телефонией: связка SmartLogger и Avaya стала источником аудио, идентификаторов звонков и служебных метаданных;
- управление очередями и состоянием: Redis хранит промежуточные данные и помогает устойчиво обрабатывать до 57 параллельных звонков;
- безопасность: весь контур — внутри инфраструктуры банка, без вывода медицинских данных наружу; настроена авторизация, разграничение прав и аудит действий.

Для рынка это сигнал: LLM уже можно использовать не только в чат-ботах и маркетинге, но и в процессах с медицинским контекстом — если чётко ограничить роль модели и выстроить архитектуру вокруг неё.

Как работать с LLM, когда ошибаться нельзя

Команда выбрала Qwen3‑30B не как «медицинского эксперта», а как инструмент структурирования текста. Модель не ставит диагнозы и не спорит с врачами. Её задача — из длинной русскоязычной транскрибации вытащить факты и аккуратно разложить их по полям.

Ключевые решения, которые важны для любого игрока рынка, работающего с LLM в чувствительных сценариях:

Температура 0.1. Команда сознательно «задушила» креативность модели. Нужна не фантазия, а повторяемость: один и тот же текст должен давать максимально похожий результат.
Жёсткий системный промпт. В промпте подробно описали:
- роль модели (ассистент по структурированию данных);
- формат ответа (JSON-подобная структура);
- правило: если в расшифровке нет данных, модель пишет «Не указано», а не угадывает.
JSON-подобный ответ. LLM сразу возвращает структуру, которую backend может валидировать и безопасно прокинуть дальше в CRM.
Негативные примеры в промптах. Команда явно описала, чего делать нельзя:
- не выдумывать ФИО;
- не подменять жалобу диагнозом;
- не ставить код МКБ по одному слову без контекста;
- не заполнять поля тем, чего нет в разговоре.

Базовое правило проекта — «если данных нет в разговоре, не придумываем». Это прямой ответ на главный страх рынка: LLM, которая уверенно выдумывает медицинские факты.

Плюсы и минусы подхода

Что хорошо:

оператор не отвлекается от живого общения с человеком, а рутину берёт на себя ИИ;
снижается время постобработки звонка — черновик уже готов, остаётся проверить и поправить;
повышается качество данных в CRM: меньше пропусков и случайных ошибок из-за спешки;
LLM работает в закрытом контуре и не уносит медицинскую информацию наружу;
архитектура учитывает реальную нагрузку — до 57 параллельных звонков.

Что сложно и кому может не подойти:

сценарий требует интеграции с телефонией и CRM, без доступа к этим системам эффект будет слабее;
нужна команда, которая умеет не только настраивать LLM, но и строить над ней устойчивый сервис;
медицинский контекст накладывает жёсткие требования к промптам и проверкам, это не «быстрый чат-бот за выходные».

Для игроков рынка, которые хотят «заменить людей ИИ», этот кейс не про то. Он про осторожное внедрение LLM в критичные процессы, где человек остаётся ответственным.

Что это значит для вас

Если вы работаете в страховой медицине или кол-центре

Этот кейс показывает, что ИИ-агент уже может стать частью команды, а не внешним виджетом:

можно сократить время обработки звонков без потери качества сервиса;
можно уменьшить нагрузку на операторов в пиковые часы;
можно аккуратно использовать LLM, не передавая данные наружу.

Но придётся инвестировать в архитектуру: интеграции с телефонией, очереди, хранение состояния и контроль доступа.

Если вы строите продукты на базе LLM

Из этого проекта можно забрать несколько практических уроков:

не пытайтесь сделать из LLM врача или независимого эксперта там, где цена ошибки высока;
начинайте с роли «структуризатор текста» и добавляйте ответственность очень дозировано;
жёстко задавайте формат ответа и поведение на отсутствие данных;
снижайте температуру и добавляйте негативные примеры в промпты, если важна предсказуемость;
думайте не только о модели, но и о контуре вокруг неё: очереди, сессии, безопасность.

Если вы пользователь страховых сервисов

Непрямой, но важный эффект: такие решения повышают шанс, что оператор не пропустит важную деталь из вашего рассказа и не перепутает данные в спешке.

ИИ не решит за вас медицинские вопросы. Но он может помочь оператору быстрее и точнее оформить ваше обращение, пока вы разговариваете с живым человеком, а не с роботом.