- Дата публикации
30 000 звонков в день: как Avito строит речевую аналитику для кол‑центров
Что появилось / что изменилось
Avito запустил внутренний сервис речевой аналитики для трёх направлений недвижимости: «Комфортная сделка», «Новостройки» и «Ипотека и страхование». Кол‑центры этих продуктов совершают до 30 000 звонков в сутки, и раньше команды успевали вручную прослушать около 3% разговоров.
Теперь в пилоте работает первая версия системы, которая:
- Автоматически ищет возражения клиентов в транскриптах звонков.
- Относит каждое возражение к одному из 8 типов:
- не готов участвовать в программе;
- хочу продавать сам;
- не хочу работать по договору;
- не хочу работать с агентом;
- неинтересно;
- не хочу платить комиссию / слишком большая комиссия / дорого;
- надо подумать;
- надо посоветоваться.
- Фиксирует ответ оператора на каждое возражение.
- Оценивает, как оператор отработал ситуацию:
- была отработка;
- не было отработки;
- не было возможности отработать (например, звонок оборвался).
- Возвращает всё в виде JSON‑структуры: тип возражения, цитата из транскрипта, реплика оператора и текст отработки.
Система уже используется руководителями кол‑центров для контроля качества и анализа влияния работы операторов на conversion rate (CR) в программах недвижимости, новостроек, ипотеки и страховок.
Как это работает
Точка входа — транскрипции звонков. Avito сначала проверяет, что расшифровки доступны и корректно извлекаются, потом очищает их: удаляет пустые записи и звонки с автоответчиками.
Дальше включается пайплайн из шести шагов:
- Подготовка данных. Очистка и сбор выборки звонков для разметки.
- Первый проект разметки. Руководители кол‑центров руками помечают диалоги: где возражение, какого типа, как оператор ответил, была ли отработка. На этом шаге команда формирует целевой формат JSON‑выдачи.
- Промпт для авторазметки. На основе ручных примеров собирают промпт и запускают авторазметку части датасета с помощью LLM.
- Второй проект разметки. Те же руководители оценивают качество авторазметки: сравнивают с эталоном, фиксируют ошибки по типам.
- Обучение LoRA‑адаптера. На размеченных данных обучают адаптер поверх базовой языковой модели. Цель — улучшить распознавание именно «недвижимых» сценариев и восьми типов возражений.
- Третий проект разметки. Асессоры проверяют уже ответы модели с LoRA‑адаптацией и оценивают итоговое качество.
Каждое наблюдение — это один звонок. Его одновременно оценивают три асессора, чтобы сгладить субъективность. Для первой итерации берут несколько десятков звонков, для следующих — выборки по несколько сотен.
Результат работы сервиса — структурированный JSON, который можно сразу отправить в аналитику: считать частоту типов возражений, смотреть, как разные операторы с ними справляются и как это связано с CR.
Что это значит для вас
Если вы строите или развиваете кол‑центр, кейс Avito показывает, что можно выжать из обычных записей разговоров:
- Контроль качества без тотального прослушивания. Вместо выборочных 3% проверок вы получаете структуру по тысячам звонков и видите, где операторы игнорируют возражения или нарушают скрипты.
- Продуктовая аналитика на языке клиентов. Клиенты сами рассказывают, почему не хотят в программу, не готовы к ипотеке или считают комиссию высокой. Это готовый вход для изменения оффера и сценариев продаж.
- Обучение операторов на реальных кейсах. Можно собирать подборки: «возражение — не хочу договор» + «успешная отработка» и использовать их как базу для тренингов.
- Оценка влияния конкретных фраз на CR. Когда возражения размечены по типам и видно, как их отрабатывают, можно связать это с конверсией в сделку и понять, какие практики реально работают.
Где такая система особенно полезна:
- Массовые продажи по телефону: недвижимость, финсервисы, подписки.
- Любые сценарии, где есть чёткие скрипты и важна юридическая корректность формулировок.
- Продукты, где критичны риски мошенничества: модель помогает находить попытки обойти сервис и договорённости «в обход площадки».
Где подход может не зайти:
- Очень короткие, однотипные звонки (например, служба доставки), где почти нет содержательных возражений.
- Истории, где важен эмоциональный тон, а не структура аргументов. Здесь одной текстовой разметки недостаточно, нужен анализ интонаций и пауз.
Место на рынке
Avito не продаёт этот сервис как отдельный продукт, это внутренняя система для их кол‑центров в недвижимости. По сути, это пример, как крупный маркетплейс строит узкоспециализированную речевую аналитику поверх общих LLM‑технологий.
Ключевые особенности подхода:
- Упор на конкретную бизнес‑метрику — CR по сделкам, ипотеке и страховкам, а не на абстрактное «качество диалога».
- Использование LoRA‑адаптера поверх базовой модели вместо обучения с нуля. Это снижает стоимость и ускоряет запуск.
- Разметку ведут руководители кол‑центров, а не внешние асессоры. Это повышает релевантность критериев и решает вопрос с персональными данными.
Если вы сравниваете, что делать у себя: покупать готовый SaaS для кол‑центров или собирать свою систему, кейс Avito — аргумент в пользу кастомной надстройки над LLM, когда у вас большой поток звонков (десятки тысяч в день) и чётко определённые сценарии разговора.