- Дата публикации
SurfSense: open-source альтернатива NotebookLM для командной работы с ИИ
Что появилось / что изменилось
SurfSense — это open-source альтернатива NotebookLM, заточенная под команды и совместную работу. Проект уже сейчас выглядит как полноценное рабочее пространство для исследований на базе ИИ, а не просто «чат с моделью».
Ключевые возможности на текущий момент:
- Самостоятельный развёртываемый сервер через Docker — можно держать всё у себя, без передачи данных внешним SaaS.
- Поддержка 25+ внешних коннекторов: поисковые системы, Google Drive, Slack, Microsoft Teams, Jira, Notion, GitHub, Discord и другие популярные сервисы.
- Общие чаты в реальном времени: несколько человек одновременно обсуждают один и тот же набор данных и ответы модели.
- Гибридный поиск по знаниям: одновременно семантический и полнотекстовый, с обязательными ссылками на источники в ответах.
- Глубокая агентная архитектура: планирование, подзадачи (subagents), доступ к файловой системе.
- Поддержка 100+ LLM и более 6000 моделей эмбеддингов через OpenAI-совместимые API и LiteLLM.
- Работа с 50+ форматами файлов, включая парсинг через Docling и локальные парсеры.
- Генерация подкастов на базе нескольких TTS-провайдеров.
- Кросс-браузерное расширение: сохранение динамических и требующих авторизации веб-страниц прямо в knowledge base.
- Ролевое разграничение прав (RBAC) для команд.
В планах у авторов:
- Автоматическая генерация слайдов.
- Многоязычные подкасты.
- Агент для создания видео.
- Десктопное и мобильное приложение.
Исходный код доступен на GitHub: https://github.com/MODSetter/SurfSense
Как это работает
SurfSense не привязан к одной конкретной модели. Он подключается к любому LLM, который совместим с OpenAI API, и использует LiteLLM как прослойку. Это позволяет переключаться между десятками моделей и тысячами вариантов эмбеддингов без переписывания кода.
Система собирает данные из подключённых источников через коннекторы: поисковые движки, корпоративные хранилища, мессенджеры и таск-трекеры. Эти данные индексируются с помощью гибридного поиска: семантические эмбеддинги + обычный полнотекстовый индекс. При запросе SurfSense сначала ищет релевантные документы, а потом подаёт их в LLM. В ответе всегда есть ссылки на конкретные файлы или сообщения.
Агентная архитектура позволяет разбивать задачу на шаги: план, подагенты, работа с файловой системой. Например, один агент ищет документы, другой структурирует, третий готовит сводку или сценарий для подкаста. Через TTS-провайдеры SurfSense превращает текстовые сводки в аудиофайлы. Браузерное расширение фиксирует не только статический HTML, но и контент за логином, что важно для внутренних дашбордов и админок.
Что это значит для вас
SurfSense имеет смысл рассматривать, если вы:
- работаете командой над большим объёмом внутренних документов и хотите чат с ИИ, который опирается на ваши знания, а не только на публичный интернет;
- не готовы отдавать конфиденциальные данные в облачные сервисы и хотите разворачивать всё в своей инфраструктуре;
- экспериментируете с агентами, RAG, поиском и собственными пайплайнами поверх LLM.
Подойдёт для:
- продуктовых и аналитических команд: быстрые сводки по Confluence/Notion, Jira, Slack;
- техподдержки: поиск ответов по базе тикетов, документации, GitHub-issues;
- контент-команд: подготовка сценариев, дайджестов и подкастов на основе внутренних материалов;
- исследовательских групп: коллективная работа с научными статьями, кодом и заметками.
Не лучший вариант, если:
- вы хотите «из коробки» простой чат с одной моделью без настройки инфраструктуры;
- у вас нет ресурсов на развёртывание Docker-сервиса и поддержку собственного стека ИИ;
- вам важна только одна конкретная коммерческая модель, и не нужен выбор из сотен вариантов.
SurfSense можно развернуть на своих серверах или в облаке по вашему выбору. Доступность в России зависит от того, какие LLM и TTS-провайдеры вы подключите: часть из них может требовать VPN или обход ограничений. Сам по себе SurfSense — это open-source-проект на GitHub, его код доступен без ограничений.
Место на рынке
SurfSense напрямую конкурирует с NotebookLM от Google по сценарию «ИИ-помощник, который знает ваши документы». Главное отличие — фокус на командах и open-source-подход. NotebookLM — облачный сервис с закрытым кодом и жёсткой привязкой к экосистеме Google. SurfSense предлагает самостоятельное развёртывание и поддержку десятков поставщиков LLM.
По функциональности SurfSense ближе к корпоративным решениям класса RAG-платформ: поддержка 25+ коннекторов, 50+ форматов файлов, 100+ LLM и 6000+ моделей эмбеддингов. Плюс — встроенные агентные сценарии и генерация подкастов, чего часто нет в классических «чат-над-документами».
Цифровых сравнений по скорости, качеству ответов или стоимости запросов автор не приводит. Итоговая цена и производительность зависят от того, какие LLM и инфраструктуру вы выберете. SurfSense даёт каркас: коннекторы, поиск, агентов, интерфейс и права доступа. Всё остальное — на стороне ваших моделей и железа.
Если вам нужен контролируемый, расширяемый и командный аналог NotebookLM, который можно собрать под себя, SurfSense выглядит логичным кандидатом для теста в пилотном проекте.