Дата публикации
ai_products

30 000 звонков в день: как Avito строит речевую аналитику для кол‑центров

Что появилось / что изменилось

Avito запустил внутренний сервис речевой аналитики для трёх направлений недвижимости: «Комфортная сделка», «Новостройки» и «Ипотека и страхование». Кол‑центры этих продуктов совершают до 30 000 звонков в сутки, и раньше команды успевали вручную прослушать около 3% разговоров.

Теперь в пилоте работает первая версия системы, которая:

  • Автоматически ищет возражения клиентов в транскриптах звонков.
  • Относит каждое возражение к одному из 8 типов:
    • не готов участвовать в программе;
    • хочу продавать сам;
    • не хочу работать по договору;
    • не хочу работать с агентом;
    • неинтересно;
    • не хочу платить комиссию / слишком большая комиссия / дорого;
    • надо подумать;
    • надо посоветоваться.
  • Фиксирует ответ оператора на каждое возражение.
  • Оценивает, как оператор отработал ситуацию:
    • была отработка;
    • не было отработки;
    • не было возможности отработать (например, звонок оборвался).
  • Возвращает всё в виде JSON‑структуры: тип возражения, цитата из транскрипта, реплика оператора и текст отработки.

Система уже используется руководителями кол‑центров для контроля качества и анализа влияния работы операторов на conversion rate (CR) в программах недвижимости, новостроек, ипотеки и страховок.

Как это работает

Точка входа — транскрипции звонков. Avito сначала проверяет, что расшифровки доступны и корректно извлекаются, потом очищает их: удаляет пустые записи и звонки с автоответчиками.

Дальше включается пайплайн из шести шагов:

  1. Подготовка данных. Очистка и сбор выборки звонков для разметки.
  2. Первый проект разметки. Руководители кол‑центров руками помечают диалоги: где возражение, какого типа, как оператор ответил, была ли отработка. На этом шаге команда формирует целевой формат JSON‑выдачи.
  3. Промпт для авторазметки. На основе ручных примеров собирают промпт и запускают авторазметку части датасета с помощью LLM.
  4. Второй проект разметки. Те же руководители оценивают качество авторазметки: сравнивают с эталоном, фиксируют ошибки по типам.
  5. Обучение LoRA‑адаптера. На размеченных данных обучают адаптер поверх базовой языковой модели. Цель — улучшить распознавание именно «недвижимых» сценариев и восьми типов возражений.
  6. Третий проект разметки. Асессоры проверяют уже ответы модели с LoRA‑адаптацией и оценивают итоговое качество.

Каждое наблюдение — это один звонок. Его одновременно оценивают три асессора, чтобы сгладить субъективность. Для первой итерации берут несколько десятков звонков, для следующих — выборки по несколько сотен.

Результат работы сервиса — структурированный JSON, который можно сразу отправить в аналитику: считать частоту типов возражений, смотреть, как разные операторы с ними справляются и как это связано с CR.

Что это значит для вас

Если вы строите или развиваете кол‑центр, кейс Avito показывает, что можно выжать из обычных записей разговоров:

  • Контроль качества без тотального прослушивания. Вместо выборочных 3% проверок вы получаете структуру по тысячам звонков и видите, где операторы игнорируют возражения или нарушают скрипты.
  • Продуктовая аналитика на языке клиентов. Клиенты сами рассказывают, почему не хотят в программу, не готовы к ипотеке или считают комиссию высокой. Это готовый вход для изменения оффера и сценариев продаж.
  • Обучение операторов на реальных кейсах. Можно собирать подборки: «возражение — не хочу договор» + «успешная отработка» и использовать их как базу для тренингов.
  • Оценка влияния конкретных фраз на CR. Когда возражения размечены по типам и видно, как их отрабатывают, можно связать это с конверсией в сделку и понять, какие практики реально работают.

Где такая система особенно полезна:

  • Массовые продажи по телефону: недвижимость, финсервисы, подписки.
  • Любые сценарии, где есть чёткие скрипты и важна юридическая корректность формулировок.
  • Продукты, где критичны риски мошенничества: модель помогает находить попытки обойти сервис и договорённости «в обход площадки».

Где подход может не зайти:

  • Очень короткие, однотипные звонки (например, служба доставки), где почти нет содержательных возражений.
  • Истории, где важен эмоциональный тон, а не структура аргументов. Здесь одной текстовой разметки недостаточно, нужен анализ интонаций и пауз.

Место на рынке

Avito не продаёт этот сервис как отдельный продукт, это внутренняя система для их кол‑центров в недвижимости. По сути, это пример, как крупный маркетплейс строит узкоспециализированную речевую аналитику поверх общих LLM‑технологий.

Ключевые особенности подхода:

  • Упор на конкретную бизнес‑метрику — CR по сделкам, ипотеке и страховкам, а не на абстрактное «качество диалога».
  • Использование LoRA‑адаптера поверх базовой модели вместо обучения с нуля. Это снижает стоимость и ускоряет запуск.
  • Разметку ведут руководители кол‑центров, а не внешние асессоры. Это повышает релевантность критериев и решает вопрос с персональными данными.

Если вы сравниваете, что делать у себя: покупать готовый SaaS для кол‑центров или собирать свою систему, кейс Avito — аргумент в пользу кастомной надстройки над LLM, когда у вас большой поток звонков (десятки тысяч в день) и чётко определённые сценарии разговора.


Читайте также

30 000 звонков в день: как Avito строит речевую аналитику для кол‑центров — VogueTech | VogueTech