- Дата публикации
ИИ-агент на медпульте: как Совкомбанк превратил LLM в «третью руку» оператора
Что произошло
Совкомбанк Технологии вместе со Страховой Группой Совкомбанка за несколько недель ИИ-марафона собрали рабочий сервис для медицинского пульта страховой компании.
Ключевые факты:
- формат: внутренний ИИ-марафон Совкомбанка (по сути — корпоративный хакатон с обязательным рабочим прототипом, а не только презентацией);
- команда: аналитик, backend-разработчики, специалист по интеграциям, ML/LLM-инженеры, тестировщики и бизнес-заказчики;
- цель: автоматизировать ввод данных по звонкам на медпульт и встроить LLM в живой процесс с высокой ценой ошибки;
- нагрузка целевого контура: до 57 одновременных звонков;
- длительность одного звонка: около 3 минут, плюс до 3 минут постобработки;
- стек первой версии: Streamlit для интерфейса, FastAPI для backend, VoiceKey для распознавания речи, Qwen3‑30B в роли LLM;
- контур эксплуатации: закрытая инфраструктура банка, работа с медицинскими данными.
ИИ-агент не общается с клиентом напрямую и не ставит диагнозы. Он слушает расшифровку разговора, собирает из неё структурированный черновик обращения: ФИО, причину звонка, симптомы, предполагаемый диагноз и возможный код МКБ. Оператор видит этот черновик и сам принимает финальные решения.
Зачем это нужно
Медицинский пульт страховой компании — не просто кол-центр. Оператор одновременно:
- разговаривает с человеком, который часто находится в стрессе;
- уточняет симптомы и детали ситуации;
- ищет данные в нескольких системах;
- фиксирует жалобы, диагноз, услуги, договор;
- заполняет CRM и другие формы.
При этом звонки в пике идут почти без пауз. У оператора на всё — несколько минут. Команда проекта пошла к пользователям и увидела главную боль: оператор физически не успевает печатать с той скоростью, с которой говорит клиент.
Отсюда родилась идея «третьей руки» — ИИ, который:
- сам «слушает» расшифровку звонка;
- вытаскивает оттуда ключевые данные;
- заполняет черновик карточки обращения в CRM;
- предлагает код МКБ, если это уместно;
- оставляет человеку право на финальную правку.
Для Совкомбанк Технологий это способ проверить, можно ли безопасно встроить LLM в процесс, где ошибка бьёт по людям и по репутации. Для страхового бизнеса — шанс сократить время на рутину, разгрузить операторов и повысить качество данных в системе.
Важно, что команда изначально отказалась от идеи «ИИ вместо оператора». Стратегия ровно обратная: ИИ снимает рутину, а человек остаётся центром принятия решений.
Что меняет для рынка
От «игры с нейросетью» к рабочему контуру
Большинство быстрых экспериментов с LLM в страховании и медицине заканчиваются на красивом демо. Здесь команда прошла путь от прототипа к архитектуре, которую можно встраивать в реальные процессы.
Два этапа разработки:
-
Быстрый прототип
- Streamlit — простой веб-интерфейс без отдельной frontend-команды.
- FastAPI — лёгкий backend для приёма аудио и выдачи результата.
- VoiceKey — сервис распознавания речи для расшифровки звонка.
- Qwen3‑30B — LLM, которая не «советует», а структурирует.
Оператор загружал запись и через несколько секунд видел:
- ФИО клиента;
- причину обращения;
- описанные симптомы;
- предполагаемый диагноз;
- предложенный код МКБ.
Это доказало жизнеспособность сценария: из сырой расшифровки можно быстро получить удобный черновик.
-
Переход к рабочему сценарию
Когда стало ясно, что идея работает, команда переключилась на:
- интеграцию с телефонией: связка SmartLogger и Avaya стала источником аудио, идентификаторов звонков и служебных метаданных;
- управление очередями и состоянием: Redis хранит промежуточные данные и помогает устойчиво обрабатывать до 57 параллельных звонков;
- безопасность: весь контур — внутри инфраструктуры банка, без вывода медицинских данных наружу; настроена авторизация, разграничение прав и аудит действий.
Для рынка это сигнал: LLM уже можно использовать не только в чат-ботах и маркетинге, но и в процессах с медицинским контекстом — если чётко ограничить роль модели и выстроить архитектуру вокруг неё.
Как работать с LLM, когда ошибаться нельзя
Команда выбрала Qwen3‑30B не как «медицинского эксперта», а как инструмент структурирования текста. Модель не ставит диагнозы и не спорит с врачами. Её задача — из длинной русскоязычной транскрибации вытащить факты и аккуратно разложить их по полям.
Ключевые решения, которые важны для любого игрока рынка, работающего с LLM в чувствительных сценариях:
-
Температура 0.1. Команда сознательно «задушила» креативность модели. Нужна не фантазия, а повторяемость: один и тот же текст должен давать максимально похожий результат.
-
Жёсткий системный промпт. В промпте подробно описали:
- роль модели (ассистент по структурированию данных);
- формат ответа (JSON-подобная структура);
- правило: если в расшифровке нет данных, модель пишет «Не указано», а не угадывает.
-
JSON-подобный ответ. LLM сразу возвращает структуру, которую backend может валидировать и безопасно прокинуть дальше в CRM.
-
Негативные примеры в промптах. Команда явно описала, чего делать нельзя:
- не выдумывать ФИО;
- не подменять жалобу диагнозом;
- не ставить код МКБ по одному слову без контекста;
- не заполнять поля тем, чего нет в разговоре.
Базовое правило проекта — «если данных нет в разговоре, не придумываем». Это прямой ответ на главный страх рынка: LLM, которая уверенно выдумывает медицинские факты.
Плюсы и минусы подхода
Что хорошо:
- оператор не отвлекается от живого общения с человеком, а рутину берёт на себя ИИ;
- снижается время постобработки звонка — черновик уже готов, остаётся проверить и поправить;
- повышается качество данных в CRM: меньше пропусков и случайных ошибок из-за спешки;
- LLM работает в закрытом контуре и не уносит медицинскую информацию наружу;
- архитектура учитывает реальную нагрузку — до 57 параллельных звонков.
Что сложно и кому может не подойти:
- сценарий требует интеграции с телефонией и CRM, без доступа к этим системам эффект будет слабее;
- нужна команда, которая умеет не только настраивать LLM, но и строить над ней устойчивый сервис;
- медицинский контекст накладывает жёсткие требования к промптам и проверкам, это не «быстрый чат-бот за выходные».
Для игроков рынка, которые хотят «заменить людей ИИ», этот кейс не про то. Он про осторожное внедрение LLM в критичные процессы, где человек остаётся ответственным.
Что это значит для вас
Если вы работаете в страховой медицине или кол-центре
Этот кейс показывает, что ИИ-агент уже может стать частью команды, а не внешним виджетом:
- можно сократить время обработки звонков без потери качества сервиса;
- можно уменьшить нагрузку на операторов в пиковые часы;
- можно аккуратно использовать LLM, не передавая данные наружу.
Но придётся инвестировать в архитектуру: интеграции с телефонией, очереди, хранение состояния и контроль доступа.
Если вы строите продукты на базе LLM
Из этого проекта можно забрать несколько практических уроков:
- не пытайтесь сделать из LLM врача или независимого эксперта там, где цена ошибки высока;
- начинайте с роли «структуризатор текста» и добавляйте ответственность очень дозировано;
- жёстко задавайте формат ответа и поведение на отсутствие данных;
- снижайте температуру и добавляйте негативные примеры в промпты, если важна предсказуемость;
- думайте не только о модели, но и о контуре вокруг неё: очереди, сессии, безопасность.
Если вы пользователь страховых сервисов
Непрямой, но важный эффект: такие решения повышают шанс, что оператор не пропустит важную деталь из вашего рассказа и не перепутает данные в спешке.
ИИ не решит за вас медицинские вопросы. Но он может помочь оператору быстрее и точнее оформить ваше обращение, пока вы разговариваете с живым человеком, а не с роботом.