Дата публикации
ai_products

PixlStash: локальный менеджер изображений для ComfyUI и LoRA‑тренировок

Что появилось / что изменилось

PixlStash 1.0.0b2 — опенсорсный локальный менеджер изображений для тех, кто генерирует картинки в ComfyUI и похожих инструментах. Проект уже дошёл до публичной беты, автор сам пользуется им каждый день.

Что умеет сейчас:

  • Быстрый импорт изображений:
    • мониторинг локальных папок;
    • drag & drop отдельных файлов и ZIP‑архивов.
  • Чтение и показ метаданных из ComfyUI с возможностью вернуть workflow обратно в ComfyUI.
  • Автотегирование и автогенерация описаний изображений с поддержкой инференса на GPU и настраиваемым VRAM‑бюджетом.
  • Отдельный тюнингованый convnext‑base для тегов типичных AI‑артефактов: Flux Chin, Waxy Skin, Bad Anatomy и другие.
  • Быстрая грид‑галерея с поэтапной подгрузкой изображений.
  • Создание персонажей и сетов картинок с экспортом, включая подписи для обучения LoRA.
  • Сортировка по дате, оценке, похожести на конкретного персонажа, по группам похожести, по тексту и по «умной» оценке, собранной из метрик и аномальных тегов.
  • Полностью офлайн‑режим, все данные хранятся локально.
  • Поддержка Windows, macOS и Linux:
    • установка через PyPI;
    • Windows‑инсталлятор;
    • Docker‑образы;
    • сборка из исходников.
  • Плагин‑система для пакетной обработки изображений (фильтры и трансформации по батчам).
  • Запуск I2I и T2I‑workflow ComfyUI прямо из интерфейса PixlStash с автоимпортом результатов.
    • По умолчанию встроен Flux 2 Klein (поддерживает и image edit, и text‑to‑image).
    • Пользователь может добавлять свои workflow через экспорт в API JSON в ComfyUI и импорт в настройках PixlStash.
  • Горячие клавиши: ESC — закрыть просмотр, DEL — удалить, Ctrl+V — импорт из буфера обмена, плюс шорткаты для навигации и проставления оценок.
  • Поддержка HTTP/HTTPS и выбор директории хранения через конфиги.
  • Автотегирование аномалий с учётом VRAM‑лимита, чтобы не съедать всю память, нужную для генерации.

Планы до релиза 1.0.0:

  • Фильтрация по моделям и workflow.
  • Постоянное улучшение тега аномалий.
  • Более простой первый запуск: настройка хранилища и создание пользователя.

Дальнейшие планы:

  • Мультипользовательский режим (сейчас логин только для одного пользователя).
  • Больше горячих клавиш и нормальная документация по ним.
  • Inpainting: выделение области и запуск I2I‑workflow для дорисовки.

Как это работает

PixlStash — это локальное веб‑приложение, которое ставится как Python‑пакет, через Docker или нативный инсталлятор под Windows. Интерфейс работает по HTTP/HTTPS, а хранилище изображений и база метаданных живут на вашей машине.

Под капотом несколько ключевых компонентов:

  • Импорт и метаданные. Приложение следит за выбранными папками и/или принимает drag & drop. Для картинок, сгенерированных в ComfyUI, PixlStash читает встроенные метаданные и вытаскивает из них workflow. Этот же workflow можно отправить обратно в ComfyUI и продолжить работу.

  • Автотегирование и описания. Для анализа картинок используется модель convnext‑base, дообученная на типичных дефектах генерации: неестественный подбородок (Flux Chin), «пластиковая» кожа (Waxy Skin), плохая анатомия и прочие артефакты. Параллельно система генерирует текстовые теги и описания, используя GPU. Пользователь задаёт лимит VRAM, чтобы PixlStash не конфликтовал с основным генератором.

  • Галерея и сортировка. Интерфейс строит грид с поэтапной подгрузкой, чтобы не тормозить на больших архивах. Сортировки завязаны на дату, оценки, похожесть на выбранного персонажа, текстовые данные и интегральный smart‑score, который учитывает и метрики, и аномальные теги.

  • Интеграция с ComfyUI. Внутри PixlStash можно запускать заранее сохранённые I2I и T2I‑workflow. По умолчанию присутствует Flux 2 Klein, но пользователь может экспортировать любой свой workflow из ComfyUI в формат API JSON и подключить его в настройках.

  • Плагины. Через плагин‑систему можно навешивать фильтры и операции на батчи картинок — от простых преобразований до сложных пайплайнов подготовки датасета под LoRA.

Что это значит для вас

Если вы генерируете сотни и тысячи изображений в ComfyUI, Stable Diffusion или похожих инструментах, PixlStash решает сразу несколько бытовых проблем:

  • Хаос в папках. Вместо десятков директорий и дубликатов вы получаете единую базу с грид‑просмотром, тегами, оценками и поиском по содержанию.

  • Работа с LoRA. Для тех, кто тренирует свои LoRA:

    • удобно собирать сеты под конкретного персонажа;
    • экспортировать их с подписями;
    • быстро отбраковывать кадры с артефактами по тегам Flux Chin / Waxy Skin / Bad Anatomy и smart‑score.
  • Диагностика качества. Автотеги аномалий помогают понять, где у вашего пайплайна системные проблемы: анатомия, кожа, лицо. Это ускоряет цикл «сгенерировал → посмотрел → поправил модель/настройки».

  • Приватность и офлайн. Всё хранится локально, работает без интернета. Для России это плюс: не нужен зарубежный аккаунт, не приходится обходить блокировки. Если вы запускаете Docker‑образ из GitHub, может потребоваться VPN на этапе скачивания, но сама работа PixlStash VPN не требует.

  • Интеграция в текущий стек. Если вы уже живёте в ComfyUI, PixlStash превращается в надстройку над вашим генератором: вы не теряете workflow, можете запускать T2I/I2I прямо из менеджера и не прыгать между окнами.

Кому это особенно полезно:

  • авторам, которые много экспериментируют с персонажами и стилями;
  • тем, кто регулярно тренирует LoRA и собирает датасеты;
  • небольшим студиям и фрилансерам, где один ПК выполняет и генерацию, и разбор результатов.

Не самый удачный сценарий — разовая генерация десятка картинок. В таком объёме проще обойтись файловой системой. PixlStash раскрывается на тысячах изображений и регулярной работе.

Место на рынке

PixlStash идёт в нишу между классическими фотоменеджерами и тулзами для Stable Diffusion.

По сравнению с обычными просмотрщиками вроде стандартных галерей ОС или простых DAM‑систем, PixlStash даёт то, чего там обычно нет:

  • чтение и возврат workflow из ComfyUI;
  • автотеги именно AI‑артефактов (Flux Chin, Waxy Skin, Bad Anatomy и другие);
  • запуск I2I/T2I‑пайплайнов прямо из интерфейса;
  • экспорт сетов с подписями специально под LoRA.

По отношению к самим генераторам (ComfyUI, AUTOMATIC1111 и т.п.) PixlStash закрывает задачу, которую те решают слабо: долгосрочное хранение и разбор огромных архивов. Генераторы умеют создать картинку и показать историю, но не рассчитаны на систематизацию десятков тысяч файлов с тонкой фильтрацией по похожести персонажей и качеству.

Отдельный плюс — опенсорс и локальный запуск на Windows, macOS и Linux, включая Docker. Это удобно для тех, кто не хочет отдавать свои датасеты в облако и предпочитает контролировать железо и VRAM‑бюджет.

Скачать и установить можно с сайта проекта: https://pixlstash.dev/install.html или из репозитория GitHub: https://github.com/Pikselkroken/pixlstash. Автор планирует релиз 1.0.0 в течение ближайшего месяца и активно собирает обратную связь по тому, чего не хватает и что работает не так.


Читайте также

PixlStash: локальный менеджер изображений для ComfyUI и LoRA‑тренировок — VogueTech | VogueTech