Дата публикации
ai_products

Thoth: локальный AI-ассистент с личным графом знаний и десктопным приложением

Что нового

Thoth — это десктопный AI-ассистент с открытым исходным кодом, который делает ставку на локальный запуск и «суверенность» данных пользователя. Главные новшества по сравнению с типичными ассистентами в браузере или Telegram-ботами:

  1. Полностью локальный режим через Ollama

    • Поддержка 39 заранее отобранных моделей в Ollama.
    • Ассистент работает полностью офлайн, если вы используете только локальные модели.
    • При желании можно подключить облачные модели: GPT от OpenAI, Claude от Anthropic, модели Google AI, xAI, OpenRouter, а также доступ к ChatGPT / Codex через подписку.
  2. Долговременная память как граф знаний, а не просто чат-лог

    • Хранение информации в виде сущностей и типизированных связей, а не отдельных сообщений.
    • 67 типов связей и 10 типов сущностей, визуальный граф, семантический поиск через FAISS и расширение на один шаг по графу.
    • Экспорт в Obsidian-совместимое хранилище: один .md файл на сущность, [[wiki-links]], YAML-фронтматтер, индексы по типам.
  3. Dream Cycle — ночная переработка знаний

    • Пятифазный ночной цикл:
      • объединение дубликатов при схожести ≥ 0,93,
      • обогащение описаний,
      • затухание устаревшей уверенности,
      • вывод недостающих связей с ограничением на «хабы»,
      • генерация «действуемых инсайтов».
    • Встроенный «дневник снов» и трёхслойная защита от контаминации памяти.
  4. Designer Studio для документов, презентаций и прототипов

    • Пять режимов: deck / document / landing / app_mockup / storyboard.
    • Интерактивный рантайм, цикл «критика → исправление», экспорт в PDF / HTML / PNG / PPTX.
    • Публикация интерактивных ссылок.
    • Поддержка генерации и редактирования изображений (OpenAI, Google, xAI) и видео (Google Veo, xAI Grok Imagine Video).
  5. Реальное управление компьютером с ограничителями

    • Агент на базе LangGraph ReAct с 30 основными инструментами и автогенерацией инструментов под каналы (Telegram, WhatsApp и т.д.).
    • Управление браузером (Chromium с видимым окном), оболочкой, файловой системой, документами, Gmail, Google Calendar, X (Twitter), графом памяти, системным статусом.
    • Все опасные действия требуют подтверждения: удаление файлов, запуск потенциально опасных команд, удаление писем и событий.
  6. Автоматизация и фоновые workflows

    • Многошаговые пайплайны со:
      • расписаниями (ежедневно, по будням, по выходным, интервалы, cron, задержка),
      • webhook-триггерами,
      • ветвлениями по условиям,
      • шагами с ручным подтверждением,
      • подзадачами,
      • группами конкуренции,
      • выбором модели и инструментов на уровне каждого workflow.
    • Workflow Console показывает текущие задания, ожидающие подтверждения и историю запусков прямо в интерфейсе чата.
  7. Десктопное приложение с одним кликом установки

    • Windows и macOS, установщик .exe и .dmg, без необходимости открывать терминал, ставить Docker или править конфиги.
    • Трей-иконка, мастер первого запуска, голосовой ввод, локальный TTS Kokoro, системные уведомления.
    • Встроенные каналы сообщений: Telegram, WhatsApp, Discord, Slack, SMS.
  8. Расширяемость без централизованного аккаунта

    • Песочница для плагинов с маркетплейсом и горячей перезагрузкой.
    • Поддержка Model Context Protocol (MCP) для подключения внешних серверов-инструментов.
    • Делегирование коду через Claude Code Delegation (CLI-инструмент как внешний «кодер» с подтверждением).
    • Мастер миграции данных из Hermes/OpenClaw с бэкапами и редактированными отчётами.
  9. Жёсткая приватность

    • Нет аккаунтов, нет собственных серверов, нет телеметрии.
    • Все долговременные данные лежат локально.
    • API-ключи и токены подписок хранятся в системном хранилище учётных данных (Windows/macOS), а в директории Thoth остаются только файлы с метаданными.
  10. Системные требования и режимы работы

  • Для локальных моделей (Ollama):
    • минимум: Windows 10/11 или macOS 12+, Python 3.11+, 8 ГБ RAM (для моделей 8B), ~5 ГБ на диск для приложения и небольшой модели qwen3:8b,
    • рекомендовано: 16–32 ГБ RAM для моделей 14B–30B, ~20+ ГБ на диск под несколько моделей, GPU с 8+ ГБ VRAM или Apple Silicon для заметного ускорения.
    • дефолтная модель qwen3:14b (~9 ГБ) нормально работает на CPU с 16 ГБ RAM, но GPU ускоряет ответы.
  • Для режима только с провайдерами (без локальных моделей):
    • 4 ГБ RAM, ~1 ГБ на диск, GPU не нужен, постоянный интернет обязателен.

Как это работает

Архитектура

Thoth — это нативное десктопное приложение (pywebview + NiceGUI) с локальным backend-агентом на базе LangGraph ReAct.

Основные блоки:

  • NiceGUI-фронтенд (app.py + пакет ui/):

    • боковая панель с тредами и управлением,
    • чат с потоковой выдачей токенов и статусом инструментов,
    • 14 вкладок настроек и мониторинга,
    • просмотр графа знаний,
    • панель одобрений для опасных действий,
    • статусный монитор с аватаром, 17 «пилюлями» здоровья и кнопкой диагностики.
  • LangGraph ReAct-агент (agent.py):

    • системный промпт с инструкциями по использованию инструментов, работе с памятью и само-знанием,
    • механизм прерывания для запросов подтверждения опасных действий,
    • автоматический recall: семантический поиск по FAISS + расширение на один шаг по графу знаний,
    • выбор модели на уровне каждого треда и workflow (локальная или облачная).
  • Хранилища и сервисы под капотом:

    • LLM:
      • локальные модели через Ollama,
      • облачные: GPT (OpenAI), Claude (Anthropic), Google AI, xAI, OpenRouter, ChatGPT/Codex по подписке.
    • Граф знаний: SQLite + NetworkX для сущностей и связей.
    • FAISS — векторное хранилище для семантического поиска по документам и памяти.
    • Отдельная SQLite-база для тредов.

Граф знаний и Document Intelligence

Thoth не просто сохраняет переписку. Он извлекает из неё и из документов структурированные сущности и связи:

  • Документный пайплайн: map-reduce через LLM:

    • поддержка PDF, DOCX, EPUB, HTML, Markdown,
    • выделение сущностей и 67 типов отношений,
    • хранение источников (provenance),
    • ограничения на количество сущностей и запрет самоссылок.
  • Графовая память:

    • 10 типов сущностей (люди, проекты, задачи и т.п.),
    • направленные типизированные связи,
    • семантический поиск + расширение на один шаг по графу,
    • визуализация, редактирование, экспорт в Obsidian.
  • Dream Cycle:

    • каждую ночь ассистент проходится по памяти,
    • объединяет дубликаты при косинусной схожести ≥ 0,93,
    • обогащает описания,
    • снижает уверенность в устаревших фактах,
    • ищет новые связи с ограничением на «центральные» узлы и кэш отклонённых гипотез,
    • создаёт записи о действиях, которые стоит выполнить.

Инструменты и управление компьютером

У Thoth 30 основных модулей инструментов, многие содержат несколько операций. Дополнительно для каждого подключенного канала (Telegram, WhatsApp и т.д.) автоматически создаются инструменты отправки сообщений, фото и документов.

Ключевые группы:

Поиск и знания

  • Web Search через Tavily (нужен TAVILY_API_KEY).
  • DuckDuckGo, Wikipedia, Arxiv, YouTube, чтение URL.
  • Семантический поиск по загруженным документам (FAISS).
  • Работа с wiki vault — чтение, поиск, перестройка, экспорт в Obsidian.

Продуктивность

  • Gmail (поиск, чтение, черновики, отправка, вложения) через OAuth.
  • Google Calendar (создание, перенос, удаление событий) через OAuth.
  • Файловая система в песочнице: чтение/запись/копирование/перемещение/удаление только внутри рабочей папки (~/Documents/Thoth по умолчанию).
  • Поддержка чтения PDF, CSV, Excel (.xlsx/.xls), JSON/JSONL, TSV, изображений.
  • Структурные файлы анализируются через pandas: схема, статистика, предпросмотр.
  • Экспорт в PDF через Playwright с резервом на fpdf2.
  • Shell-команды с трёхуровневой классификацией: безопасные (авто), умеренные (с подтверждением), заблокированные (например, shutdown, reboot, mkfs).
  • Браузер на базе Chromium: навигация, клики, ввод, прокрутка, работа с вкладками, снимки, отдельный профиль для логинов.
  • Workflows: создание, обновление, удаление и запуск сложных сценариев с расписаниями и условиями.
  • Tracker: учёт лекарств, симптомов, спорта, сна, настроения, менструального цикла; streak-анализ, экспорт в CSV.
  • Автоинструменты для каналов: отправка сообщений, фото, документов, приём голоса с транскрипцией.

Соцсети, медиа и дизайн

  • X (Twitter): чтение, поиск, постинг, ответы, лайки, репосты, закладки, удаление через OAuth 2.0 PKCE.
  • Image Generation: генерация и редактирование изображений через OpenAI, xAI (Grok Imagine), Google (Imagen 4, Nano Banana).
  • Video Generation: короткие клипы по тексту или референс-изображению через Google Veo и xAI Grok Imagine Video.
  • Designer Studio: создание презентаций, лендингов, отчётов, мокапов и сторибордов с генерацией медиа и диаграмм (Mermaid, Plotly).

Вычисления и анализ

  • Калькулятор (арифметика, тригонометрия, логарифмы, комбинаторика).
  • Wolfram Alpha (нужен WOLFRAM_ALPHA_APPID).
  • Погода через Open-Meteo.
  • Vision: захват с камеры, скриншоты, анализ изображений в рабочей папке через vision-модель.
  • Memory: работа с графом памяти (создание, поиск, обновление, удаление, связывание, исследование).
  • Conversation Search: поиск по прошлым диалогам и список сохранённых тредов.
  • System Info: ОС, CPU, RAM, диск, IP, батарея, топ процессов.
  • Chart: интерактивные графики Plotly (bar, line, scatter, pie, histogram, box, area, heatmap) и экспорт в PNG.

Безопасность и разрешения

  • Все разрушительные действия требуют подтверждения:

    • workspace_file_delete, workspace_move_file,
    • run_command (умеренный риск),
    • send_gmail_message, move_calendar_event, delete_calendar_event,
    • delete_memory, tracker_delete, task_delete.
  • Песочница файловой системы: доступен только настроенный workspace (~/Documents/Thoth по умолчанию).

  • Shell-команды:

    • безопасные выполняются сразу,
    • умеренные требуют подтверждения,
    • опасные заблокированы,
    • для фоновых задач можно задать белые списки префиксов команд.
  • Браузер: отдельные вкладки на каждый тред и задачу, очистка после завершения.

  • Пермишены для фоновых задач настраиваются отдельно (например, список разрешённых адресатов в Gmail).

  • Операции с Gmail/Calendar разделены на уровни: чтение, запись, разрушительные — каждый можно включать и выключать.

  • MCP-инструменты: по умолчанию выключены после импорта, имена в отдельном пространстве, опасные операции требуют подтверждения, сломанные сервера переходят в режим диагностики, а не ломают запуск.

  • Защита от prompt-injection: пятислойное сканирование на:

    • попытки переписать инструкции,
    • имитацию ролей,
    • утечку данных,
    • обход через кодировки,
    • социальную инженерию.

Все инструменты можно отключать в настройках, чтобы упростить выбор для модели и уменьшить поверхность атаки.

Что это значит для вас

Для кого Thoth имеет смысл

  1. Те, кто хочет максимальную приватность
    Если вы не готовы отправлять свои заметки, документы и историю переписки на сервера OpenAI или Google, Thoth даёт альтернативу:

    • все долговременные данные и документы лежат на вашем диске,
    • можно работать только с локальными моделями через Ollama,
    • нет аккаунта, нет сторонней телеметрии.
  2. Исследователи, разработчики, продакты и аналитики с большим объёмом знаний
    Граф знаний и Dream Cycle полезны, если вы:

    • ведёте много проектов,
    • работаете с научными статьями, документацией, отчётами,
    • хотите, чтобы ассистент не просто искал по тексту, а понимал связи между людьми, задачами, решениями.

    Вы можете:

    • кидать в Thoth PDF-отчёты, DOCX-спеки, EPUB-книги, HTML-страницы,
    • получать структурированные сущности и связи,
    • экспортировать всё в Obsidian и продолжать работать там.
  3. Люди, которые не любят терминал, но хотят локальный AI
    Thoth ставится одним кликом на Windows и macOS, без npm install, WSL2 и ручных конфигов.
    Если OpenClaw и подобные проекты кажутся слишком «девелоперскими», Thoth проще вхождения.

  4. Пользователи, которым нужен ассистент, реально управляющий компьютером
    Thoth умеет:

    • открывать сайты, кликать, логиниться и собирать данные,
    • запускать shell-команды в песочнице,
    • читать и обновлять файлы,
    • работать с Gmail и Google Calendar,
    • генерировать презентации, лендинги и отчёты в Designer Studio.

    При этом все рискованные действия проходят через явное подтверждение.

  5. Те, кто живёт в мессенджерах
    Если вы общаетесь с ассистентом в Telegram, Slack или WhatsApp, Thoth может стать центральной точкой:

    • поддержка пяти каналов из коробки: Telegram, WhatsApp, Discord, Slack, SMS,
    • единая логика для медиа, стриминга, одобрений, health-check,
    • туннель для вебхуков.

В каких задачах Thoth полезен

  • Личный второй мозг:

    • сбор информации по проектам,
    • заметки по книгам и статьям,
    • связи между людьми, встречами, решениями,
    • поиск по графу знаний и документам.
  • Подготовка презентаций и документов:

    • презентации для встреч,
    • одностраничники продуктов,
    • отчёты и аналитика с диаграммами Plotly и Mermaid,
    • сториборды и мокапы для приложений.
  • Автоматизация рутины:

    • ежедневные/еженедельные отчёты,
    • напоминания и проверки статуса задач,
    • мониторинг источников через web search + Arxiv + YouTube,
    • рассылка дайджестов в Telegram/Slack.
  • Здоровье и привычки:

    • учёт лекарств, симптомов, тренировок, сна, настроения,
    • анализ серий (streaks) и трендов,
    • экспорт данных в CSV для врача или собственного анализа.
  • Разработка и эксперименты:

    • подключение внешних MCP-серверов как инструментов,
    • использование Claude Code CLI как отдельного «работника» для кода,
    • локальный playground для разных моделей Ollama и облачных LLM.

Где Thoth не подойдёт

  • Если вам нужен мобильный ассистент с нативными iOS/Android-приложениями, Thoth пока ориентирован на десктоп (Windows, macOS).
  • Если вы хотите «просто ChatGPT в браузере» без установки и настройки, локальный стек с Ollama и Python 3.11+ будет избыточным.
  • Если важен доступ к десяткам мессенджеров (Signal, iMessage, Teams, Matrix, IRC и др.), Thoth пока покрывает только 5 основных каналов, тогда как конкуренты дают 20+.

Доступность из России и VPN

Thoth — локальное приложение, исходный код открыт. Сам по себе он не заблокирован.
Но для работы с облачными моделями и сервисами (OpenAI, Anthropic, Google AI, xAI, OpenRouter, Tavily, Wolfram Alpha, некоторые TTS/vision API) может понадобиться VPN и зарубежные платёжные инструменты.
Локальный режим через Ollama и офлайн-память работают без VPN.

Место на рынке

Сравнение с OpenClaw

OpenClaw — популярный открытый персональный ассистент, ориентированный на разработчиков и мультиканальные сценарии. В оригинальной документации Thoth есть прямое сравнение.

Старт и установка

  • Thoth:

    • один клик: .exe или .dmg,
    • мастер настройки,
    • терминал не нужен.
  • OpenClaw:

    • установка через npm install -g openclaw@latest,
    • требуется Node.js 24,
    • на Windows нужен WSL2, нативной поддержки Windows нет.

Локальные модели и офлайн-режим

  • Thoth:

    • «local-first»: 39 моделей в Ollama из коробки,
    • может работать полностью офлайн,
    • облачные модели опциональны.
  • OpenClaw:

    • «cloud-first»: для старта нужен API-ключ,
    • локальные модели подключаются через конфигурацию провайдера.

Память и знания

  • Thoth:

    • персональный граф знаний: 10 типов сущностей, 67 типов связей,
    • визуальный граф, FAISS-поиск + 1-hop расширение,
    • Dream Cycle с 5 фазами,
    • экспорт в Obsidian.
  • OpenClaw:

    • плоские markdown-файлы (MEMORY.md + дневные заметки) с семантическим поиском,
    • нет структурированного графа.

Документы

  • Thoth:

    • map-reduce пайплайн для извлечения сущностей и связей из PDF, DOCX, EPUB, HTML, Markdown,
    • хранение связей в графе знаний.
  • OpenClaw:

    • чтение/запись/редактирование файлов в рабочем пространстве, без отдельного графа.

Голос

  • Thoth:

    • полностью локальный STT (faster-whisper) и TTS (Kokoro с 10 голосами),
    • аудио не покидает машину.
  • OpenClaw:

    • ElevenLabs (облачный TTS) + системный fallback,
    • Voice Wake на macOS/iOS.

Трекинг здоровья

  • Thoth:

    • встроенный трекер лекарств, симптомов, спорта, сна, настроения, менструального цикла,
    • анализ серий, графики на Plotly, экспорт в CSV.
  • OpenClaw:

    • отдельного трекера нет.

Инструменты

  • Thoth:

    • 30 основных инструментов + автоинструменты каналов,
    • shell, браузер, файловая система, Gmail, Calendar, Designer Studio, статус Thoth, граф памяти, MCP, генерация изображений и видео, исследовательские инструменты.
  • OpenClaw:

    • около 20 инструментов: exec, браузер, веб-поиск, canvas, cron, генерация изображений/музыки/видео.

Мессенджеры

  • Thoth:

    • 5 каналов: Telegram, WhatsApp, Discord, Slack, SMS,
    • стриминг, реакции, медиа, одобрения, туннель для вебхуков.
  • OpenClaw:

    • 23+ каналов: WhatsApp, Telegram, Slack, Discord, Signal, iMessage, Teams, Matrix, IRC и другие.

Автономные агенты и workflows

  • Thoth:

    • продвинутые workflows с условиями, расписаниями, approvals, webhook-триггерами, группами конкуренции,
    • несколько сценариев могут работать параллельно, у каждого свой тред.
  • OpenClaw:

    • мультиагентная маршрутизация с изолированными сессиями по отправителю/каналу, без столь детализированного редактора workflow.

Десктоп и мобильные клиенты

  • Thoth:

    • нативное десктопное окно (pywebview) + системный трей на Windows и macOS,
    • один клик установки.
  • OpenClaw:

    • macOS-приложение в меню-баре,
    • нет нативного Windows-клиента (нужен WSL2),
    • есть iOS и Android-компаньоны.

Дизайн / Canvas

  • Thoth:

    • Designer Studio: презентации, отчёты, лендинги, мокапы, сториборды,
    • Mermaid и Plotly рендерятся прямо в интерфейсе.
  • OpenClaw:

    • A2UI — агентно управляемое интерактивное визуальное пространство.

Плагины и экосистема

  • Thoth:

    • песочничный маркетплейс плагинов с hot-reload и security-сканированием,
    • MCP-клиент, мастер миграции, 13 ручных «скиллов» (включая Claude Code Delegation), 18 гайдов по инструментам.
  • OpenClaw:

    • npm-экосистема плагинов + реестр ClawHub,
    • большая библиотека готовых навыков.

Приватность и стоимость

  • Thoth:

    • все данные локальны,
    • нет сервера и аккаунтов,
    • бесплатен при работе с локальными моделями,
    • при использовании GPT, Claude, Google AI, xAI или OpenRouter вы платите напрямую этим провайдерам по их тарифам,
    • ChatGPT/Codex используют вашу подписку ChatGPT.
  • OpenClaw:

    • self-hosted gateway, данные остаются на вашей машине,
    • проект бесплатен и открыт,
    • для работы нужен хотя бы один облачный API-ключ.

Итого: OpenClaw логичен для разработчиков, которым нужен ассистент во всех мессенджерах сразу и не страшен терминал. Thoth целится в пользователей, которые хотят локальный интеллект с графом знаний, десктопным интерфейсом, одним кликом установки и минимальным количеством DevOps.

Установка / Как запустить

Режим с локальными моделями (Ollama)

Минимальные требования:

  • ОС: Windows 10/11 (64-bit) или macOS 12+ (Apple Silicon или Intel).
  • Python: 3.11+.
  • RAM: 8 ГБ (для моделей 8B).
  • Диск: ~5 ГБ (приложение + модель qwen3:8b).
  • GPU: не обязателен, Ollama может работать на CPU.
  • Интернет: нужен для установки и скачивания моделей, далее опционален.

Рекомендации:

  • RAM: 16–32 ГБ для моделей 14B–30B.
  • Диск: 20+ ГБ, если планируете несколько крупных моделей.
  • GPU: NVIDIA с 8+ ГБ VRAM (CUDA) или Apple Silicon — заметно ускоряют ответы.

Дефолтная локальная модель qwen3:14b (~9 ГБ) работает на CPU с 16 ГБ RAM, но GPU делает её намного быстрее. Если у вас 8 ГБ RAM, используйте qwen3:8b (~5 ГБ).

Режим только с провайдерами (без локальных моделей)

Если вы не хотите связываться с Ollama или у вас нет подходящего железа:

  • ОС: Windows 10/11 (64-bit) или macOS 12+.
  • Python: 3.11+.
  • RAM: 4 ГБ.
  • Диск: ~1 ГБ (приложение + зависимости, без моделей).
  • GPU: не нужен.
  • Интернет: обязателен, так как все запросы идут на сервера провайдеров.

Нужны API-ключи от:

  • OpenAI (для GPT),
  • Anthropic (для Claude),
  • Google AI,
  • xAI,
  • OpenRouter,
    или вход в ChatGPT внутри приложения для доступа к ChatGPT/Codex.
    Биллинг по токенам идёт по тарифам этих сервисов.

Установка Thoth

Для Windows:

  1. Скачайте последний установщик .exe с официального репозитория проекта.
  2. Запустите файл.
  3. Пройдите мастер установки и первый запуск.
  4. При необходимости установите и настройте Ollama (если хотите локальные модели).

Для macOS:

  1. Скачайте .dmg.
  2. Перетащите приложение в Applications.
  3. Запустите Thoth, следуйте мастеру настройки.
  4. Подключите Ollama и/или API-ключи провайдеров.

Дальше вы настраиваете каналы (Telegram, WhatsApp, Discord, Slack, SMS), включаете нужные инструменты и начинаете заполнять граф знаний документами и заметками.


Читайте также