- Дата публикации
Thoth: локальный AI-ассистент с личным графом знаний и десктопным приложением
Что нового
Thoth — это десктопный AI-ассистент с открытым исходным кодом, который делает ставку на локальный запуск и «суверенность» данных пользователя. Главные новшества по сравнению с типичными ассистентами в браузере или Telegram-ботами:
-
Полностью локальный режим через Ollama
- Поддержка 39 заранее отобранных моделей в Ollama.
- Ассистент работает полностью офлайн, если вы используете только локальные модели.
- При желании можно подключить облачные модели: GPT от OpenAI, Claude от Anthropic, модели Google AI, xAI, OpenRouter, а также доступ к ChatGPT / Codex через подписку.
-
Долговременная память как граф знаний, а не просто чат-лог
- Хранение информации в виде сущностей и типизированных связей, а не отдельных сообщений.
- 67 типов связей и 10 типов сущностей, визуальный граф, семантический поиск через FAISS и расширение на один шаг по графу.
- Экспорт в Obsidian-совместимое хранилище: один
.mdфайл на сущность,[[wiki-links]], YAML-фронтматтер, индексы по типам.
-
Dream Cycle — ночная переработка знаний
- Пятифазный ночной цикл:
- объединение дубликатов при схожести ≥ 0,93,
- обогащение описаний,
- затухание устаревшей уверенности,
- вывод недостающих связей с ограничением на «хабы»,
- генерация «действуемых инсайтов».
- Встроенный «дневник снов» и трёхслойная защита от контаминации памяти.
- Пятифазный ночной цикл:
-
Designer Studio для документов, презентаций и прототипов
- Пять режимов: deck / document / landing / app_mockup / storyboard.
- Интерактивный рантайм, цикл «критика → исправление», экспорт в PDF / HTML / PNG / PPTX.
- Публикация интерактивных ссылок.
- Поддержка генерации и редактирования изображений (OpenAI, Google, xAI) и видео (Google Veo, xAI Grok Imagine Video).
-
Реальное управление компьютером с ограничителями
- Агент на базе LangGraph ReAct с 30 основными инструментами и автогенерацией инструментов под каналы (Telegram, WhatsApp и т.д.).
- Управление браузером (Chromium с видимым окном), оболочкой, файловой системой, документами, Gmail, Google Calendar, X (Twitter), графом памяти, системным статусом.
- Все опасные действия требуют подтверждения: удаление файлов, запуск потенциально опасных команд, удаление писем и событий.
-
Автоматизация и фоновые workflows
- Многошаговые пайплайны со:
- расписаниями (ежедневно, по будням, по выходным, интервалы, cron, задержка),
- webhook-триггерами,
- ветвлениями по условиям,
- шагами с ручным подтверждением,
- подзадачами,
- группами конкуренции,
- выбором модели и инструментов на уровне каждого workflow.
- Workflow Console показывает текущие задания, ожидающие подтверждения и историю запусков прямо в интерфейсе чата.
- Многошаговые пайплайны со:
-
Десктопное приложение с одним кликом установки
- Windows и macOS, установщик
.exeи.dmg, без необходимости открывать терминал, ставить Docker или править конфиги. - Трей-иконка, мастер первого запуска, голосовой ввод, локальный TTS Kokoro, системные уведомления.
- Встроенные каналы сообщений: Telegram, WhatsApp, Discord, Slack, SMS.
- Windows и macOS, установщик
-
Расширяемость без централизованного аккаунта
- Песочница для плагинов с маркетплейсом и горячей перезагрузкой.
- Поддержка Model Context Protocol (MCP) для подключения внешних серверов-инструментов.
- Делегирование коду через Claude Code Delegation (CLI-инструмент как внешний «кодер» с подтверждением).
- Мастер миграции данных из Hermes/OpenClaw с бэкапами и редактированными отчётами.
-
Жёсткая приватность
- Нет аккаунтов, нет собственных серверов, нет телеметрии.
- Все долговременные данные лежат локально.
- API-ключи и токены подписок хранятся в системном хранилище учётных данных (Windows/macOS), а в директории Thoth остаются только файлы с метаданными.
-
Системные требования и режимы работы
- Для локальных моделей (Ollama):
- минимум: Windows 10/11 или macOS 12+, Python 3.11+, 8 ГБ RAM (для моделей 8B), ~5 ГБ на диск для приложения и небольшой модели
qwen3:8b, - рекомендовано: 16–32 ГБ RAM для моделей 14B–30B, ~20+ ГБ на диск под несколько моделей, GPU с 8+ ГБ VRAM или Apple Silicon для заметного ускорения.
- дефолтная модель
qwen3:14b(~9 ГБ) нормально работает на CPU с 16 ГБ RAM, но GPU ускоряет ответы.
- минимум: Windows 10/11 или macOS 12+, Python 3.11+, 8 ГБ RAM (для моделей 8B), ~5 ГБ на диск для приложения и небольшой модели
- Для режима только с провайдерами (без локальных моделей):
- 4 ГБ RAM, ~1 ГБ на диск, GPU не нужен, постоянный интернет обязателен.
Как это работает
Архитектура
Thoth — это нативное десктопное приложение (pywebview + NiceGUI) с локальным backend-агентом на базе LangGraph ReAct.
Основные блоки:
-
NiceGUI-фронтенд (
app.py+ пакетui/):- боковая панель с тредами и управлением,
- чат с потоковой выдачей токенов и статусом инструментов,
- 14 вкладок настроек и мониторинга,
- просмотр графа знаний,
- панель одобрений для опасных действий,
- статусный монитор с аватаром, 17 «пилюлями» здоровья и кнопкой диагностики.
-
LangGraph ReAct-агент (
agent.py):- системный промпт с инструкциями по использованию инструментов, работе с памятью и само-знанием,
- механизм прерывания для запросов подтверждения опасных действий,
- автоматический recall: семантический поиск по FAISS + расширение на один шаг по графу знаний,
- выбор модели на уровне каждого треда и workflow (локальная или облачная).
-
Хранилища и сервисы под капотом:
- LLM:
- локальные модели через Ollama,
- облачные: GPT (OpenAI), Claude (Anthropic), Google AI, xAI, OpenRouter, ChatGPT/Codex по подписке.
- Граф знаний: SQLite + NetworkX для сущностей и связей.
- FAISS — векторное хранилище для семантического поиска по документам и памяти.
- Отдельная SQLite-база для тредов.
- LLM:
Граф знаний и Document Intelligence
Thoth не просто сохраняет переписку. Он извлекает из неё и из документов структурированные сущности и связи:
-
Документный пайплайн: map-reduce через LLM:
- поддержка PDF, DOCX, EPUB, HTML, Markdown,
- выделение сущностей и 67 типов отношений,
- хранение источников (provenance),
- ограничения на количество сущностей и запрет самоссылок.
-
Графовая память:
- 10 типов сущностей (люди, проекты, задачи и т.п.),
- направленные типизированные связи,
- семантический поиск + расширение на один шаг по графу,
- визуализация, редактирование, экспорт в Obsidian.
-
Dream Cycle:
- каждую ночь ассистент проходится по памяти,
- объединяет дубликаты при косинусной схожести ≥ 0,93,
- обогащает описания,
- снижает уверенность в устаревших фактах,
- ищет новые связи с ограничением на «центральные» узлы и кэш отклонённых гипотез,
- создаёт записи о действиях, которые стоит выполнить.
Инструменты и управление компьютером
У Thoth 30 основных модулей инструментов, многие содержат несколько операций. Дополнительно для каждого подключенного канала (Telegram, WhatsApp и т.д.) автоматически создаются инструменты отправки сообщений, фото и документов.
Ключевые группы:
Поиск и знания
- Web Search через Tavily (нужен
TAVILY_API_KEY). - DuckDuckGo, Wikipedia, Arxiv, YouTube, чтение URL.
- Семантический поиск по загруженным документам (FAISS).
- Работа с wiki vault — чтение, поиск, перестройка, экспорт в Obsidian.
Продуктивность
- Gmail (поиск, чтение, черновики, отправка, вложения) через OAuth.
- Google Calendar (создание, перенос, удаление событий) через OAuth.
- Файловая система в песочнице: чтение/запись/копирование/перемещение/удаление только внутри рабочей папки (
~/Documents/Thothпо умолчанию). - Поддержка чтения PDF, CSV, Excel (
.xlsx/.xls), JSON/JSONL, TSV, изображений. - Структурные файлы анализируются через pandas: схема, статистика, предпросмотр.
- Экспорт в PDF через Playwright с резервом на fpdf2.
- Shell-команды с трёхуровневой классификацией: безопасные (авто), умеренные (с подтверждением), заблокированные (например,
shutdown,reboot,mkfs). - Браузер на базе Chromium: навигация, клики, ввод, прокрутка, работа с вкладками, снимки, отдельный профиль для логинов.
- Workflows: создание, обновление, удаление и запуск сложных сценариев с расписаниями и условиями.
- Tracker: учёт лекарств, симптомов, спорта, сна, настроения, менструального цикла; streak-анализ, экспорт в CSV.
- Автоинструменты для каналов: отправка сообщений, фото, документов, приём голоса с транскрипцией.
Соцсети, медиа и дизайн
- X (Twitter): чтение, поиск, постинг, ответы, лайки, репосты, закладки, удаление через OAuth 2.0 PKCE.
- Image Generation: генерация и редактирование изображений через OpenAI, xAI (Grok Imagine), Google (Imagen 4, Nano Banana).
- Video Generation: короткие клипы по тексту или референс-изображению через Google Veo и xAI Grok Imagine Video.
- Designer Studio: создание презентаций, лендингов, отчётов, мокапов и сторибордов с генерацией медиа и диаграмм (Mermaid, Plotly).
Вычисления и анализ
- Калькулятор (арифметика, тригонометрия, логарифмы, комбинаторика).
- Wolfram Alpha (нужен
WOLFRAM_ALPHA_APPID). - Погода через Open-Meteo.
- Vision: захват с камеры, скриншоты, анализ изображений в рабочей папке через vision-модель.
- Memory: работа с графом памяти (создание, поиск, обновление, удаление, связывание, исследование).
- Conversation Search: поиск по прошлым диалогам и список сохранённых тредов.
- System Info: ОС, CPU, RAM, диск, IP, батарея, топ процессов.
- Chart: интерактивные графики Plotly (bar, line, scatter, pie, histogram, box, area, heatmap) и экспорт в PNG.
Безопасность и разрешения
-
Все разрушительные действия требуют подтверждения:
workspace_file_delete,workspace_move_file,run_command(умеренный риск),send_gmail_message,move_calendar_event,delete_calendar_event,delete_memory,tracker_delete,task_delete.
-
Песочница файловой системы: доступен только настроенный workspace (
~/Documents/Thothпо умолчанию). -
Shell-команды:
- безопасные выполняются сразу,
- умеренные требуют подтверждения,
- опасные заблокированы,
- для фоновых задач можно задать белые списки префиксов команд.
-
Браузер: отдельные вкладки на каждый тред и задачу, очистка после завершения.
-
Пермишены для фоновых задач настраиваются отдельно (например, список разрешённых адресатов в Gmail).
-
Операции с Gmail/Calendar разделены на уровни: чтение, запись, разрушительные — каждый можно включать и выключать.
-
MCP-инструменты: по умолчанию выключены после импорта, имена в отдельном пространстве, опасные операции требуют подтверждения, сломанные сервера переходят в режим диагностики, а не ломают запуск.
-
Защита от prompt-injection: пятислойное сканирование на:
- попытки переписать инструкции,
- имитацию ролей,
- утечку данных,
- обход через кодировки,
- социальную инженерию.
Все инструменты можно отключать в настройках, чтобы упростить выбор для модели и уменьшить поверхность атаки.
Что это значит для вас
Для кого Thoth имеет смысл
-
Те, кто хочет максимальную приватность
Если вы не готовы отправлять свои заметки, документы и историю переписки на сервера OpenAI или Google, Thoth даёт альтернативу:- все долговременные данные и документы лежат на вашем диске,
- можно работать только с локальными моделями через Ollama,
- нет аккаунта, нет сторонней телеметрии.
-
Исследователи, разработчики, продакты и аналитики с большим объёмом знаний
Граф знаний и Dream Cycle полезны, если вы:- ведёте много проектов,
- работаете с научными статьями, документацией, отчётами,
- хотите, чтобы ассистент не просто искал по тексту, а понимал связи между людьми, задачами, решениями.
Вы можете:
- кидать в Thoth PDF-отчёты, DOCX-спеки, EPUB-книги, HTML-страницы,
- получать структурированные сущности и связи,
- экспортировать всё в Obsidian и продолжать работать там.
-
Люди, которые не любят терминал, но хотят локальный AI
Thoth ставится одним кликом на Windows и macOS, безnpm install, WSL2 и ручных конфигов.
Если OpenClaw и подобные проекты кажутся слишком «девелоперскими», Thoth проще вхождения. -
Пользователи, которым нужен ассистент, реально управляющий компьютером
Thoth умеет:- открывать сайты, кликать, логиниться и собирать данные,
- запускать shell-команды в песочнице,
- читать и обновлять файлы,
- работать с Gmail и Google Calendar,
- генерировать презентации, лендинги и отчёты в Designer Studio.
При этом все рискованные действия проходят через явное подтверждение.
-
Те, кто живёт в мессенджерах
Если вы общаетесь с ассистентом в Telegram, Slack или WhatsApp, Thoth может стать центральной точкой:- поддержка пяти каналов из коробки: Telegram, WhatsApp, Discord, Slack, SMS,
- единая логика для медиа, стриминга, одобрений, health-check,
- туннель для вебхуков.
В каких задачах Thoth полезен
-
Личный второй мозг:
- сбор информации по проектам,
- заметки по книгам и статьям,
- связи между людьми, встречами, решениями,
- поиск по графу знаний и документам.
-
Подготовка презентаций и документов:
- презентации для встреч,
- одностраничники продуктов,
- отчёты и аналитика с диаграммами Plotly и Mermaid,
- сториборды и мокапы для приложений.
-
Автоматизация рутины:
- ежедневные/еженедельные отчёты,
- напоминания и проверки статуса задач,
- мониторинг источников через web search + Arxiv + YouTube,
- рассылка дайджестов в Telegram/Slack.
-
Здоровье и привычки:
- учёт лекарств, симптомов, тренировок, сна, настроения,
- анализ серий (streaks) и трендов,
- экспорт данных в CSV для врача или собственного анализа.
-
Разработка и эксперименты:
- подключение внешних MCP-серверов как инструментов,
- использование Claude Code CLI как отдельного «работника» для кода,
- локальный playground для разных моделей Ollama и облачных LLM.
Где Thoth не подойдёт
- Если вам нужен мобильный ассистент с нативными iOS/Android-приложениями, Thoth пока ориентирован на десктоп (Windows, macOS).
- Если вы хотите «просто ChatGPT в браузере» без установки и настройки, локальный стек с Ollama и Python 3.11+ будет избыточным.
- Если важен доступ к десяткам мессенджеров (Signal, iMessage, Teams, Matrix, IRC и др.), Thoth пока покрывает только 5 основных каналов, тогда как конкуренты дают 20+.
Доступность из России и VPN
Thoth — локальное приложение, исходный код открыт. Сам по себе он не заблокирован.
Но для работы с облачными моделями и сервисами (OpenAI, Anthropic, Google AI, xAI, OpenRouter, Tavily, Wolfram Alpha, некоторые TTS/vision API) может понадобиться VPN и зарубежные платёжные инструменты.
Локальный режим через Ollama и офлайн-память работают без VPN.
Место на рынке
Сравнение с OpenClaw
OpenClaw — популярный открытый персональный ассистент, ориентированный на разработчиков и мультиканальные сценарии. В оригинальной документации Thoth есть прямое сравнение.
Старт и установка
-
Thoth:
- один клик:
.exeили.dmg, - мастер настройки,
- терминал не нужен.
- один клик:
-
OpenClaw:
- установка через
npm install -g openclaw@latest, - требуется Node.js 24,
- на Windows нужен WSL2, нативной поддержки Windows нет.
- установка через
Локальные модели и офлайн-режим
-
Thoth:
- «local-first»: 39 моделей в Ollama из коробки,
- может работать полностью офлайн,
- облачные модели опциональны.
-
OpenClaw:
- «cloud-first»: для старта нужен API-ключ,
- локальные модели подключаются через конфигурацию провайдера.
Память и знания
-
Thoth:
- персональный граф знаний: 10 типов сущностей, 67 типов связей,
- визуальный граф, FAISS-поиск + 1-hop расширение,
- Dream Cycle с 5 фазами,
- экспорт в Obsidian.
-
OpenClaw:
- плоские markdown-файлы (
MEMORY.md+ дневные заметки) с семантическим поиском, - нет структурированного графа.
- плоские markdown-файлы (
Документы
-
Thoth:
- map-reduce пайплайн для извлечения сущностей и связей из PDF, DOCX, EPUB, HTML, Markdown,
- хранение связей в графе знаний.
-
OpenClaw:
- чтение/запись/редактирование файлов в рабочем пространстве, без отдельного графа.
Голос
-
Thoth:
- полностью локальный STT (faster-whisper) и TTS (Kokoro с 10 голосами),
- аудио не покидает машину.
-
OpenClaw:
- ElevenLabs (облачный TTS) + системный fallback,
- Voice Wake на macOS/iOS.
Трекинг здоровья
-
Thoth:
- встроенный трекер лекарств, симптомов, спорта, сна, настроения, менструального цикла,
- анализ серий, графики на Plotly, экспорт в CSV.
-
OpenClaw:
- отдельного трекера нет.
Инструменты
-
Thoth:
- 30 основных инструментов + автоинструменты каналов,
- shell, браузер, файловая система, Gmail, Calendar, Designer Studio, статус Thoth, граф памяти, MCP, генерация изображений и видео, исследовательские инструменты.
-
OpenClaw:
- около 20 инструментов:
exec, браузер, веб-поиск, canvas, cron, генерация изображений/музыки/видео.
- около 20 инструментов:
Мессенджеры
-
Thoth:
- 5 каналов: Telegram, WhatsApp, Discord, Slack, SMS,
- стриминг, реакции, медиа, одобрения, туннель для вебхуков.
-
OpenClaw:
- 23+ каналов: WhatsApp, Telegram, Slack, Discord, Signal, iMessage, Teams, Matrix, IRC и другие.
Автономные агенты и workflows
-
Thoth:
- продвинутые workflows с условиями, расписаниями, approvals, webhook-триггерами, группами конкуренции,
- несколько сценариев могут работать параллельно, у каждого свой тред.
-
OpenClaw:
- мультиагентная маршрутизация с изолированными сессиями по отправителю/каналу, без столь детализированного редактора workflow.
Десктоп и мобильные клиенты
-
Thoth:
- нативное десктопное окно (pywebview) + системный трей на Windows и macOS,
- один клик установки.
-
OpenClaw:
- macOS-приложение в меню-баре,
- нет нативного Windows-клиента (нужен WSL2),
- есть iOS и Android-компаньоны.
Дизайн / Canvas
-
Thoth:
- Designer Studio: презентации, отчёты, лендинги, мокапы, сториборды,
- Mermaid и Plotly рендерятся прямо в интерфейсе.
-
OpenClaw:
- A2UI — агентно управляемое интерактивное визуальное пространство.
Плагины и экосистема
-
Thoth:
- песочничный маркетплейс плагинов с hot-reload и security-сканированием,
- MCP-клиент, мастер миграции, 13 ручных «скиллов» (включая Claude Code Delegation), 18 гайдов по инструментам.
-
OpenClaw:
- npm-экосистема плагинов + реестр ClawHub,
- большая библиотека готовых навыков.
Приватность и стоимость
-
Thoth:
- все данные локальны,
- нет сервера и аккаунтов,
- бесплатен при работе с локальными моделями,
- при использовании GPT, Claude, Google AI, xAI или OpenRouter вы платите напрямую этим провайдерам по их тарифам,
- ChatGPT/Codex используют вашу подписку ChatGPT.
-
OpenClaw:
- self-hosted gateway, данные остаются на вашей машине,
- проект бесплатен и открыт,
- для работы нужен хотя бы один облачный API-ключ.
Итого: OpenClaw логичен для разработчиков, которым нужен ассистент во всех мессенджерах сразу и не страшен терминал. Thoth целится в пользователей, которые хотят локальный интеллект с графом знаний, десктопным интерфейсом, одним кликом установки и минимальным количеством DevOps.
Установка / Как запустить
Режим с локальными моделями (Ollama)
Минимальные требования:
- ОС: Windows 10/11 (64-bit) или macOS 12+ (Apple Silicon или Intel).
- Python: 3.11+.
- RAM: 8 ГБ (для моделей 8B).
- Диск: ~5 ГБ (приложение + модель
qwen3:8b). - GPU: не обязателен, Ollama может работать на CPU.
- Интернет: нужен для установки и скачивания моделей, далее опционален.
Рекомендации:
- RAM: 16–32 ГБ для моделей 14B–30B.
- Диск: 20+ ГБ, если планируете несколько крупных моделей.
- GPU: NVIDIA с 8+ ГБ VRAM (CUDA) или Apple Silicon — заметно ускоряют ответы.
Дефолтная локальная модель qwen3:14b (~9 ГБ) работает на CPU с 16 ГБ RAM, но GPU делает её намного быстрее. Если у вас 8 ГБ RAM, используйте qwen3:8b (~5 ГБ).
Режим только с провайдерами (без локальных моделей)
Если вы не хотите связываться с Ollama или у вас нет подходящего железа:
- ОС: Windows 10/11 (64-bit) или macOS 12+.
- Python: 3.11+.
- RAM: 4 ГБ.
- Диск: ~1 ГБ (приложение + зависимости, без моделей).
- GPU: не нужен.
- Интернет: обязателен, так как все запросы идут на сервера провайдеров.
Нужны API-ключи от:
- OpenAI (для GPT),
- Anthropic (для Claude),
- Google AI,
- xAI,
- OpenRouter,
или вход в ChatGPT внутри приложения для доступа к ChatGPT/Codex.
Биллинг по токенам идёт по тарифам этих сервисов.
Установка Thoth
Для Windows:
- Скачайте последний установщик
.exeс официального репозитория проекта. - Запустите файл.
- Пройдите мастер установки и первый запуск.
- При необходимости установите и настройте Ollama (если хотите локальные модели).
Для macOS:
- Скачайте
.dmg. - Перетащите приложение в
Applications. - Запустите Thoth, следуйте мастеру настройки.
- Подключите Ollama и/или API-ключи провайдеров.
Дальше вы настраиваете каналы (Telegram, WhatsApp, Discord, Slack, SMS), включаете нужные инструменты и начинаете заполнять граф знаний документами и заметками.