Hippo: общая память для AI‑агентов вроде Claude Code, Cursor и ChatGPT — VogueTech

Что появилось / что изменилось

Hippo — это локальная «память» для AI‑агентов, которая работает поверх разных инструментов: Claude Code, Codex, Cursor, OpenClaw и любых CLI‑агентов. Она хранит данные в SQLite, а зеркала — в markdown/YAML, так что всё можно положить в git и читать как обычные файлы. Runtime-зависимостей нет, нужен только Node.js 22.5+; эмбеддинги опциональны через @xenova/transformers.

Главное в версии 0.9.1:

Авто‑sleep при выходе из Claude Code. Команда hippo hook install claude-code добавляет Stop‑hook в ~/.claude/settings.json, а hippo init делает то же, если находит Claude Code. Hippo сам вызывает hippo sleep при завершении сессии, без cron и ручных команд.

Что добавили в 0.9.0:

Рабочая память: hippo wm push/read/clear/flush. Это ограниченный буфер до 20 элементов на scope с вытеснением по важности. Краткосрочные заметки хранятся отдельно от долгосрочных воспоминаний.
Передача сессий: hippo handoff create/latest/show. Hippo сохраняет резюме сессии, следующие шаги и артефакты, чтобы следующая сессия продолжила без «раскопок» в логах.
Явный жизненный цикл сессий: старт/конец, резервные session ID и hippo session resume для продолжения работы.
Объяснимый поиск: hippo recall --why показывает, какие термины совпали, что сработало — BM25 или эмбеддинги, и из какого «слоя» пришла память (уровень уверенности, локальная или глобальная).
hippo current show — компактный снимок текущего состояния: активная задача плюс недавние события сессии, готовый для инъекции в промпт.
Усиление работы с SQLite: busy_timeout=5000, synchronous=NORMAL, wal_autocheckpoint=100. Параллельные вызовы плагинов больше не упираются в SQLITE_BUSY.
Пакетная консолидация: все записи и удаления происходят в одной транзакции, а не в серии открытий/закрытий.
Флаг --limit для hippo recall и hippo context, который ограничивает число результатов отдельно от токенного бюджета.
Защита от двойной инъекции контекста при переподключении плагина.

В 0.8.0 появились:

Гибридный поиск: BM25 по ключевым словам + косинусное сходство эмбеддингов. Устанавливаете @xenova/transformers, запускаете hippo embed — качество recall заметно растёт. Без эмбеддингов всё работает только на BM25.
«Схемная» оценка новых воспоминаний: Hippo автоматически считает, насколько новая память похожа на уже существующие. Знакомые паттерны закрепляются быстрее, а редкие и неиспользуемые факты быстрее «выцветают».

Как это работает

Hippo решает две проблемы. Первая — AI‑агент, будь то Claude Code или Cursor, забывает всё между сессиями. Вторая — память размазана по разным инструментам: ChatGPT знает одно, Claude 4 — другое, а правила Cursor живут в .cursorrules и не попадают в Codex.

Hippo добавляет поверх этого слой памяти, который не привязан к одному вендору. Бэкенд — SQLite, рядом лежат зеркала в markdown/YAML. Это значит: можно версионировать память в git, смотреть diff, чистить руками и переносить между проектами простым копированием папки.

Команды выглядят просто:

npm install -g hippo-memory
hippo init
hippo remember "FRED cache silently dropped the tips_10y series" --tag error
hippo recall "data pipeline issues" --budget 2000

remember записывает событие, теги и метаданные. recall ищет по запросу, учитывая ограничение по токенам. С 0.8.0 поиск может работать в гибридном режиме: сначала BM25 по словам, затем доранжирование по эмбеддингам. --why показывает, почему конкретный кусок памяти попал в выдачу.

Механика «забывания» встроена в ядро. Hippo хранит уровень уверенности, считает «схемную» близость к уже известным паттернам и постепенно уменьшает вес устаревших или неиспользуемых записей. Ошибки и баги, наоборот, закрепляются сильнее через отдельный слой error‑памяти.

Рабочая память (wm) — это отдельный буфер до 20 элементов на каждый scope. Hippo выкидывает наименее важные записи, когда буфер переполнен, и не смешивает их с долгосрочными воспоминаниями. Это похоже на заметки «что я делаю прямо сейчас», которые не обязаны жить вечно.

Что это значит для вас

Если вы пишете код с Claude Code в понедельник, переключаетесь на Cursor во вторник, а в среду открываете Codex, Hippo даёт общую память поверх всех этих инструментов. Инструкция CLAUDE.md, правила из .cursorrules и заметки из ChatGPT превращаются в единую базу в вашем репозитории.

Полезные сценарии:

Мульти‑инструментальная разработка. Один и тот же контекст, правила код‑ревью, соглашения по стилю и частые баги доступны в любом агенте, который умеет читать CLI‑вывод или плагины Hippo.
Команды, у которых агенты «наступают на те же грабли». Hippo помечает ошибки (--tag error), хранит их дольше и не даёт агенту по‑новой проходить через тот же деплой‑баг.
Пользователи с раздутым CLAUDE.md. Вместо 400 строк хаотичных инструкций Hippo раскладывает всё по тегам, уровням уверенности и позволяет старым workaround‑ам постепенно выгорать.
Те, кому важно отсутствие привязки к одному сервису. Память — это markdown в вашем репо. Чтобы уйти с одного инструмента на другой, достаточно перенести папку.

Не лучший вариант, если вы общаетесь только с одним чатом в браузере и не хотите ставить Node.js 22.5+. Hippo — это инструмент для разработчиков, которые не боятся CLI и готовы один раз настроить хуки для своих IDE и агентов.

С точки зрения приватности всё хранится локально, в SQLite и markdown/YAML. Никакого облачного бэкенда по умолчанию. Если вы работаете в закрытом контуре, это плюс, но ответственность за бэкапы и безопасность лежит на вас.

Место на рынке

Hippo конкурирует не с GPT‑5 или Claude 4, а с подходом «сохраняем всё в одном сервисе и потом ищем по истории». Типичный пример — длинный CLAUDE.md, внутренние заметки в ChatGPT или правила в .cursorrules, которые не выходят за пределы одного инструмента.

Главное отличие Hippo — общая память для разных агентов и отсутствие привязки к вендору. Вместо того чтобы держать отдельные правила для Claude Code, Cursor и Codex, вы храните их в Hippo и подключаете через CLI и плагины. Память живёт рядом с кодом в git, а не в чьей‑то проприетарной базе.

По сравнению с простым «сохраняем всё в SQLite и ищем по ключевым словам» Hippo добавляет несколько уровней: рабочую память, долгосрочное хранение, error‑память, decay‑механику и гибридный поиск BM25+эмбеддинги. Это делает его ближе к «мозгу агента», чем к файловому шкафу со старыми логами.

Чётких цифр по скорости или стоимости у Hippo нет, но архитектура без внешних зависимостей и локальный SQLite означают предсказуемое поведение: нет счёта за токены при каждом recall, нет сетевых задержек до внешнего API. Цена — ваше время на установку Node.js 22.5+ и настройку хуков под свои инструменты.

Что появилось / что изменилось

Как это работает

Что это значит для вас

Место на рынке

Читайте также