Дата публикации
ai_products

«Яндекс Разговор» научился распознавать речь офлайн и записывать длинные монологи

Что нового

Яндекс выпустил крупное обновление приложения «Разговор» — сервиса для общения людей с нарушениями слуха и речи.

Ключевые изменения:

  • Офлайн-распознавание речи
    Теперь приложение понимает устную речь без подключения к интернету. Это работает на смартфоне локально.

  • Два режима работы

    • «Диалог» — формат чата: реплики пользователя и собеседника отображаются как сообщения.
    • «Монолог» — непрерывная расшифровка речи без ограничений по длине текста. Пока экран включён, «Разговор» записывает всё, что говорит спикер.
  • Экспорт и шэринг
    Расшифровку монолога можно:

    • сохранить в приложении;
    • скачать в формате PDF;
    • поделиться с коллегами или близкими любым удобным способом.
  • Английский язык
    Приложение теперь распознаёт и синтезирует речь не только на русском, но и на английском. Для этого нужно выбрать английский как основной язык в системных настройках смартфона.

  • Организация заметок

    • создание папок для сохранённых диалогов и монологов;
    • разделение, например, на рабочие и личные разговоры;
    • отдельные подборки для типичных ситуаций — кафе, магазины, салоны и т.п.
  • Поиск по истории
    Поиск по ключевым словам по всем сохранённым расшифровкам. Это позволяет быстро найти нужную фразу без прокрутки длинной истории.

  • Настройки интерфейса

    • светлая и тёмная темы;
    • настройка размера шрифта;
    • синхронизация темы и шрифта с системными настройками смартфона.
      Всё это помогает людям с нарушениями зрения комфортнее пользоваться приложением.
  • Доступность и платформы

    • Android и iOS;
    • для устойчивой работы офлайн-распознавания на Android Яндекс рекомендует Android 14 и новее.
  • Масштаб использования
    В 2025 году «Яндекс Разговор» использовали 272 тысячи человек, которые инициировали более 1,4 млн диалогов.

Как это работает

«Разговор» опирается на технологии распознавания и синтеза речи Яндекса, которые компания использует и в других сервисах (например, в голосовом ассистенте и продуктах с озвучкой текста).

Под капотом происходят три основных процесса:

  1. Локальное распознавание речи
    Раньше приложение отправляло аудио на серверы Яндекса для обработки. Теперь на смартфон загружается компактная языковая и акустическая модель, которая:

    • принимает аудио с микрофона;
    • преобразует его в текст прямо на устройстве;
    • не требует постоянного интернет-соединения.
  2. Синтез речи из текста
    Когда пользователю сложно говорить, он набирает текст. «Разговор» превращает этот текст в голос.
    Для русского и английского языков используются голосовые движки Яндекса, знакомые по другим продуктам компании.

  3. Структурирование и хранение данных

    • Расшифровки диалогов и монологов сохраняются в приложении.
    • Пользователь раскладывает их по папкам.
    • Вся история индексируется для поиска по ключевым словам.
    • Монологи можно конвертировать в PDF для дальнейшей отправки или архивирования.

Ограничений по длине текста в режиме «Монолог» нет: запись продолжается, пока активен экран смартфона. Это важно для лекций, долгих совещаний и конференций.

Что это значит для вас

Кому «Разговор» особенно полезен

  • Глухим и слабослышащим людям

    • Общение с незнакомыми людьми в транспорте, магазине, кафе, поликлинике.
    • Разговор с врачом, администратором, водителем — всё сразу появляется текстом на экране.
    • Нет зависимости от качества связи и Wi‑Fi.
  • Людям с нарушениями речи

    • Набираете текст — приложение озвучивает его вслух собеседнику.
    • Подходит для повседневного общения и деловых ситуаций.
  • Студентам и специалистам

    • Режим «Монолог» подходит для конспектирования лекций, докладов, митингов.
    • После встречи можно сохранить текст, разложить по папкам («Проект А», «Учёба») и быстро искать по ключевым словам.
  • Тем, кто часто бывает без интернета

    • Поездки за город, командировки, поездки в метро и поездах с нестабильной связью.
    • Офлайн-распознавание снижает риск, что важный разговор сорвётся из-за пропавшего соединения.

Для каких задач «Разговор» подходит плохо

  • Тонкий анализ смысла и контекста
    Приложение создавали как инструмент доступности, а не как аналитический ИИ‑ассистент. Оно не подводит итоги встречи и не пишет отчёты по расшифровкам.

  • Многоголосные шумные мероприятия
    Если одновременно говорят несколько человек или вокруг сильный шум, качество распознавания может падать. Для таких задач обычно используют специализированные системы многоканальной записи и микрофоны.

  • Работа с редкими языками
    Сейчас «Разговор» поддерживает русский и английский. Если вам нужно распознавание других языков, придётся искать альтернативы.

Практические советы по использованию

  • На Android обновите систему до Android 14 или выше — это повысит стабильность офлайн-режима.
  • Включайте режим «Монолог» на лекциях, совещаниях и конференциях, если нужно получить полный текст выступления.
  • Используйте папки для типовых сценариев: «Работа», «Учёба», «Медицина», «Быт» — так нужный диалог проще найти.
  • Если часто переключаетесь между тёмной и светлой темами на смартфоне, включите синхронизацию темы и шрифта в настройках приложения.

Приложение доступно в России, не требует VPN и работает на Android и iOS через стандартные магазины приложений.

Место на рынке

«Яндекс Разговор» занимает специфичную нишу: это не «общий» голосовой помощник, а инструмент доступности для людей с нарушениями слуха и речи.

Важные отличия от других решений:

  • Фокус на инклюзивности
    «Разговор» проектировали под реальные сценарии людей с инвалидностью: общение в транспорте, магазинах, кафе, у врача.
    В экосистеме Яндекса уже есть адаптированные для незрячих и слабовидящих пользователей сервисы — «Такси», «Почта», «Браузер», «Книги», «Музыка», «Яндекс Go», «Кинопоиск» с тифлокомментариями. «Разговор» дополняет эту линию сервисов.

  • Глубокая интеграция с голосовыми технологиями Яндекса
    Те же технологии распознавания и синтеза речи используются в других продуктах компании, включая «Алису» в Яндекс Станции, которая понимает запросы людей с особенностями речи.

  • Локальная работа и конфиденциальность
    Офлайн-распознавание снижает зависимость от серверов и потенциально уменьшает объём передаваемых данных. Для многих пользователей с особыми потребностями это критично — не каждый готов отправлять все разговоры в облако.

Прямые конкуренты с таким же фокусом на русском рынке немногочисленны. Есть крупные голосовые ассистенты и приложения для заметок с функцией диктовки, но они редко заточены под сценарии глухих и слабослышащих пользователей и не всегда учитывают их потребности в интерфейсе.

Доступность и инклюзия в экосистеме Яндекса

«Разговор» не существует в вакууме. Яндекс системно развивает доступность своих сервисов:

  • 20 сервисов компании адаптированы для незрячих и слабовидящих пользователей.
  • «Алиса» в Яндекс Станции понимает голосовые запросы пользователей с особенностями речи.
  • В «Яндекс Go» есть специальные опции для людей с инвалидностью.
  • В «Кинопоиске» появились тифлокомментарии.
  • Компания адаптирует процессы найма и рабочие места для сотрудников с инвалидностью.

Для «Разговора» это значит, что приложение встраивается в более широкую стратегию доступности. Пользователь может, например, использовать его для общения офлайн, а дома — переключаться на другие сервисы Яндекса с поддержкой экранных дикторов и специальных режимов.

Подробнее о «Яндекс Разговоре» и других инклюзивных функциях можно узнать на специальных страницах Яндекса. Обновлённая версия приложения уже доступна в магазинах приложений для Android и iOS.


Читайте также