- Дата публикации
Nekofantasia: первая аниме-модель на Stable Diffusion 3.5 с ручной разметкой 4 млн изображений
Команда Nekofantasia опубликовала альфа-версию своей модели для генерации аниме-арта. Это первый подобный проект, построенный на архитектуре Stable Diffusion 3.5 и технологии Rectified Flow.
Что появилось / что изменилось
Модель Nekofantasia-alpha уже доступна для загрузки. Она обучалась на датасете из 4 миллионов изображений. Каждое изображение команда отбирала и проверяла вручную в течение двух лет. Это должно обеспечить высокое качество обучающих данных без проблем автоматической фильтрации. После всего одного дня тренировки модель демонстрирует проработку композиции и фонов на уровне моделей, основанных на SDXL. Разработчики утверждают, что стоимость обучения при этом была значительно ниже. Модель уже способна корректно генерировать изображения обнажённой женской груди и избегает характерного для многих аниме-моделей «пластикового» стиля.
Как это работает
В основе модели лежит Stable Diffusion 3.5 — флагманская архитектура компании Stability AI. Она использует механизм диффузии Rectified Flow. Разработчики выбрали эту версию, считая её наиболее продвинутой и качественной среди диффузионных моделей. Ключевая особенность проекта — тщательно подготовленный датасет. Ручная модерация 4 миллионов изображений заняла два года и направлена на устранение шума и низкокачественного контента, который портит итоговый результат. Полное обучение модели ещё не завершено из-за ограниченного финансирования.
Что это значит для вас
Nekofantasia — инструмент для художников и энтузиастов, которые хотят генерировать аниме-арт высокого качества с более естественной эстетикой. Модель подойдёт для создания иллюстраций с детализированными фонами и сложной композицией. Учитывая заявленную низкую стоимость обучения, она может быть интересна сообществу для дальнейшего развития и создания специализированных версий. Однако важно помнить, что это альфа-версия, реализовавшая лишь часть потенциала. Модель и её выходы не имеют цензуры, характерной для официального Stable Diffusion 3.5. Скачать веса можно на CivitAI и HuggingFace — эти платформы доступны из России.
Место на рынке
Nekofantasia напрямую конкурирует с популярными аниме-моделями на базе SDXL, такими как Animagine или AnyJourney. По заявлению авторов, после одного дня обучения их модель уже достигла схожего уровня в проработке композиции и фонов, но при меньших вычислительных затратах. Главное отличие — ручная работа с датасетом, что является редкостью в сообществе. Это может дать преимущество в качестве и согласованности стиля. При этом Stable Diffusion 3.5 как базовая архитектура изначально не была популярна для аниме из-за встроенной цензуры и отсутствия удобных инструментов для обучения. Nekofantasia пытается изменить этот нарратив, доказав применимость SD 3.5 в этом нишевом сегменте.