30 000 звонков в день: как Avito строит речевую аналитику для кол‑центров — VogueTech

Что появилось / что изменилось

Avito запустил внутренний сервис речевой аналитики для трёх направлений недвижимости: «Комфортная сделка», «Новостройки» и «Ипотека и страхование». Кол‑центры этих продуктов совершают до 30 000 звонков в сутки, и раньше команды успевали вручную прослушать около 3% разговоров.

Теперь в пилоте работает первая версия системы, которая:

Автоматически ищет возражения клиентов в транскриптах звонков.
Относит каждое возражение к одному из 8 типов:
- не готов участвовать в программе;
- хочу продавать сам;
- не хочу работать по договору;
- не хочу работать с агентом;
- неинтересно;
- не хочу платить комиссию / слишком большая комиссия / дорого;
- надо подумать;
- надо посоветоваться.
Фиксирует ответ оператора на каждое возражение.
Оценивает, как оператор отработал ситуацию:
- была отработка;
- не было отработки;
- не было возможности отработать (например, звонок оборвался).
Возвращает всё в виде JSON‑структуры: тип возражения, цитата из транскрипта, реплика оператора и текст отработки.

Система уже используется руководителями кол‑центров для контроля качества и анализа влияния работы операторов на conversion rate (CR) в программах недвижимости, новостроек, ипотеки и страховок.

Как это работает

Точка входа — транскрипции звонков. Avito сначала проверяет, что расшифровки доступны и корректно извлекаются, потом очищает их: удаляет пустые записи и звонки с автоответчиками.

Дальше включается пайплайн из шести шагов:

Подготовка данных. Очистка и сбор выборки звонков для разметки.
Первый проект разметки. Руководители кол‑центров руками помечают диалоги: где возражение, какого типа, как оператор ответил, была ли отработка. На этом шаге команда формирует целевой формат JSON‑выдачи.
Промпт для авторазметки. На основе ручных примеров собирают промпт и запускают авторазметку части датасета с помощью LLM.
Второй проект разметки. Те же руководители оценивают качество авторазметки: сравнивают с эталоном, фиксируют ошибки по типам.
Обучение LoRA‑адаптера. На размеченных данных обучают адаптер поверх базовой языковой модели. Цель — улучшить распознавание именно «недвижимых» сценариев и восьми типов возражений.
Третий проект разметки. Асессоры проверяют уже ответы модели с LoRA‑адаптацией и оценивают итоговое качество.

Каждое наблюдение — это один звонок. Его одновременно оценивают три асессора, чтобы сгладить субъективность. Для первой итерации берут несколько десятков звонков, для следующих — выборки по несколько сотен.

Результат работы сервиса — структурированный JSON, который можно сразу отправить в аналитику: считать частоту типов возражений, смотреть, как разные операторы с ними справляются и как это связано с CR.

Что это значит для вас

Если вы строите или развиваете кол‑центр, кейс Avito показывает, что можно выжать из обычных записей разговоров:

Контроль качества без тотального прослушивания. Вместо выборочных 3% проверок вы получаете структуру по тысячам звонков и видите, где операторы игнорируют возражения или нарушают скрипты.
Продуктовая аналитика на языке клиентов. Клиенты сами рассказывают, почему не хотят в программу, не готовы к ипотеке или считают комиссию высокой. Это готовый вход для изменения оффера и сценариев продаж.
Обучение операторов на реальных кейсах. Можно собирать подборки: «возражение — не хочу договор» + «успешная отработка» и использовать их как базу для тренингов.
Оценка влияния конкретных фраз на CR. Когда возражения размечены по типам и видно, как их отрабатывают, можно связать это с конверсией в сделку и понять, какие практики реально работают.

Где такая система особенно полезна:

Массовые продажи по телефону: недвижимость, финсервисы, подписки.
Любые сценарии, где есть чёткие скрипты и важна юридическая корректность формулировок.
Продукты, где критичны риски мошенничества: модель помогает находить попытки обойти сервис и договорённости «в обход площадки».

Где подход может не зайти:

Очень короткие, однотипные звонки (например, служба доставки), где почти нет содержательных возражений.
Истории, где важен эмоциональный тон, а не структура аргументов. Здесь одной текстовой разметки недостаточно, нужен анализ интонаций и пауз.

Место на рынке

Avito не продаёт этот сервис как отдельный продукт, это внутренняя система для их кол‑центров в недвижимости. По сути, это пример, как крупный маркетплейс строит узкоспециализированную речевую аналитику поверх общих LLM‑технологий.

Ключевые особенности подхода:

Упор на конкретную бизнес‑метрику — CR по сделкам, ипотеке и страховкам, а не на абстрактное «качество диалога».
Использование LoRA‑адаптера поверх базовой модели вместо обучения с нуля. Это снижает стоимость и ускоряет запуск.
Разметку ведут руководители кол‑центров, а не внешние асессоры. Это повышает релевантность критериев и решает вопрос с персональными данными.

Если вы сравниваете, что делать у себя: покупать готовый SaaS для кол‑центров или собирать свою систему, кейс Avito — аргумент в пользу кастомной надстройки над LLM, когда у вас большой поток звонков (десятки тысяч в день) и чётко определённые сценарии разговора.

Что появилось / что изменилось

Как это работает

Что это значит для вас

Место на рынке

Читайте также