- Дата публикации
«Яндекс Разговор» научился распознавать речь офлайн и записывать длинные монологи
Что нового
Яндекс выпустил крупное обновление приложения «Разговор» — сервиса для общения людей с нарушениями слуха и речи.
Ключевые изменения:
-
Офлайн-распознавание речи
Теперь приложение понимает устную речь без подключения к интернету. Это работает на смартфоне локально. -
Два режима работы
- «Диалог» — формат чата: реплики пользователя и собеседника отображаются как сообщения.
- «Монолог» — непрерывная расшифровка речи без ограничений по длине текста. Пока экран включён, «Разговор» записывает всё, что говорит спикер.
-
Экспорт и шэринг
Расшифровку монолога можно:- сохранить в приложении;
- скачать в формате PDF;
- поделиться с коллегами или близкими любым удобным способом.
-
Английский язык
Приложение теперь распознаёт и синтезирует речь не только на русском, но и на английском. Для этого нужно выбрать английский как основной язык в системных настройках смартфона. -
Организация заметок
- создание папок для сохранённых диалогов и монологов;
- разделение, например, на рабочие и личные разговоры;
- отдельные подборки для типичных ситуаций — кафе, магазины, салоны и т.п.
-
Поиск по истории
Поиск по ключевым словам по всем сохранённым расшифровкам. Это позволяет быстро найти нужную фразу без прокрутки длинной истории. -
Настройки интерфейса
- светлая и тёмная темы;
- настройка размера шрифта;
- синхронизация темы и шрифта с системными настройками смартфона.
Всё это помогает людям с нарушениями зрения комфортнее пользоваться приложением.
-
Доступность и платформы
- Android и iOS;
- для устойчивой работы офлайн-распознавания на Android Яндекс рекомендует Android 14 и новее.
-
Масштаб использования
В 2025 году «Яндекс Разговор» использовали 272 тысячи человек, которые инициировали более 1,4 млн диалогов.
Как это работает
«Разговор» опирается на технологии распознавания и синтеза речи Яндекса, которые компания использует и в других сервисах (например, в голосовом ассистенте и продуктах с озвучкой текста).
Под капотом происходят три основных процесса:
-
Локальное распознавание речи
Раньше приложение отправляло аудио на серверы Яндекса для обработки. Теперь на смартфон загружается компактная языковая и акустическая модель, которая:- принимает аудио с микрофона;
- преобразует его в текст прямо на устройстве;
- не требует постоянного интернет-соединения.
-
Синтез речи из текста
Когда пользователю сложно говорить, он набирает текст. «Разговор» превращает этот текст в голос.
Для русского и английского языков используются голосовые движки Яндекса, знакомые по другим продуктам компании. -
Структурирование и хранение данных
- Расшифровки диалогов и монологов сохраняются в приложении.
- Пользователь раскладывает их по папкам.
- Вся история индексируется для поиска по ключевым словам.
- Монологи можно конвертировать в PDF для дальнейшей отправки или архивирования.
Ограничений по длине текста в режиме «Монолог» нет: запись продолжается, пока активен экран смартфона. Это важно для лекций, долгих совещаний и конференций.
Что это значит для вас
Кому «Разговор» особенно полезен
-
Глухим и слабослышащим людям
- Общение с незнакомыми людьми в транспорте, магазине, кафе, поликлинике.
- Разговор с врачом, администратором, водителем — всё сразу появляется текстом на экране.
- Нет зависимости от качества связи и Wi‑Fi.
-
Людям с нарушениями речи
- Набираете текст — приложение озвучивает его вслух собеседнику.
- Подходит для повседневного общения и деловых ситуаций.
-
Студентам и специалистам
- Режим «Монолог» подходит для конспектирования лекций, докладов, митингов.
- После встречи можно сохранить текст, разложить по папкам («Проект А», «Учёба») и быстро искать по ключевым словам.
-
Тем, кто часто бывает без интернета
- Поездки за город, командировки, поездки в метро и поездах с нестабильной связью.
- Офлайн-распознавание снижает риск, что важный разговор сорвётся из-за пропавшего соединения.
Для каких задач «Разговор» подходит плохо
-
Тонкий анализ смысла и контекста
Приложение создавали как инструмент доступности, а не как аналитический ИИ‑ассистент. Оно не подводит итоги встречи и не пишет отчёты по расшифровкам. -
Многоголосные шумные мероприятия
Если одновременно говорят несколько человек или вокруг сильный шум, качество распознавания может падать. Для таких задач обычно используют специализированные системы многоканальной записи и микрофоны. -
Работа с редкими языками
Сейчас «Разговор» поддерживает русский и английский. Если вам нужно распознавание других языков, придётся искать альтернативы.
Практические советы по использованию
- На Android обновите систему до Android 14 или выше — это повысит стабильность офлайн-режима.
- Включайте режим «Монолог» на лекциях, совещаниях и конференциях, если нужно получить полный текст выступления.
- Используйте папки для типовых сценариев: «Работа», «Учёба», «Медицина», «Быт» — так нужный диалог проще найти.
- Если часто переключаетесь между тёмной и светлой темами на смартфоне, включите синхронизацию темы и шрифта в настройках приложения.
Приложение доступно в России, не требует VPN и работает на Android и iOS через стандартные магазины приложений.
Место на рынке
«Яндекс Разговор» занимает специфичную нишу: это не «общий» голосовой помощник, а инструмент доступности для людей с нарушениями слуха и речи.
Важные отличия от других решений:
-
Фокус на инклюзивности
«Разговор» проектировали под реальные сценарии людей с инвалидностью: общение в транспорте, магазинах, кафе, у врача.
В экосистеме Яндекса уже есть адаптированные для незрячих и слабовидящих пользователей сервисы — «Такси», «Почта», «Браузер», «Книги», «Музыка», «Яндекс Go», «Кинопоиск» с тифлокомментариями. «Разговор» дополняет эту линию сервисов. -
Глубокая интеграция с голосовыми технологиями Яндекса
Те же технологии распознавания и синтеза речи используются в других продуктах компании, включая «Алису» в Яндекс Станции, которая понимает запросы людей с особенностями речи. -
Локальная работа и конфиденциальность
Офлайн-распознавание снижает зависимость от серверов и потенциально уменьшает объём передаваемых данных. Для многих пользователей с особыми потребностями это критично — не каждый готов отправлять все разговоры в облако.
Прямые конкуренты с таким же фокусом на русском рынке немногочисленны. Есть крупные голосовые ассистенты и приложения для заметок с функцией диктовки, но они редко заточены под сценарии глухих и слабослышащих пользователей и не всегда учитывают их потребности в интерфейсе.
Доступность и инклюзия в экосистеме Яндекса
«Разговор» не существует в вакууме. Яндекс системно развивает доступность своих сервисов:
- 20 сервисов компании адаптированы для незрячих и слабовидящих пользователей.
- «Алиса» в Яндекс Станции понимает голосовые запросы пользователей с особенностями речи.
- В «Яндекс Go» есть специальные опции для людей с инвалидностью.
- В «Кинопоиске» появились тифлокомментарии.
- Компания адаптирует процессы найма и рабочие места для сотрудников с инвалидностью.
Для «Разговора» это значит, что приложение встраивается в более широкую стратегию доступности. Пользователь может, например, использовать его для общения офлайн, а дома — переключаться на другие сервисы Яндекса с поддержкой экранных дикторов и специальных режимов.
Подробнее о «Яндекс Разговоре» и других инклюзивных функциях можно узнать на специальных страницах Яндекса. Обновлённая версия приложения уже доступна в магазинах приложений для Android и iOS.