Сегодня речь пойдет про Qwen Image - это open-source модель для генерации и редактирования изображений с 20B параметров на архитектуре MMDIT. Qwen Image отлично генерирует сложные изображения и имеет нативную поддержку встройки текстов в изображение.
Сегодня я покажу вам быструю схему, которая в 2 раза быстрее чем базовый рабочий процесс. И при обзоре схемы покажу вам особенности настроек для генерации на Qwen Image.
Для тех кто не работает в ComfyUI покажу, как запустить модель в веб интерфейсе Wan2GP.
❗Если получаются ломаные или черные картинки, то удалите из пускового файла bat все ключи.
МЕНЮ
00:00 - Что такое Qwen Image
03:49 - Fast Lora для Qwen Image Wan2GP
04:20 - Генерация Text 2 image в Wan2GP
08:40 - Модели Qwen Image для ComfyUI
09:54 - Обзор схемы qwen image comfyui workflow
16:36 - Режим Image 2 Image Qwen Image ComfyUI
ИНСТРУКЦИЯ Wan2GP
1. Настроенная сборка WAN2GP Portable тут: ССЫЛКА И все инструкции по её установке, обновлению и запуску тоже тут.
Пост обновляется.
2. Lora qwen_image_diffsynth_distill: ССЫЛКА Все варианты этих lora: ТУТ ( loras_qwen )
ИНСТРУКЦИЯ ComfyUI
1. Установите настроенную сборку ComfyUI с triton или без него по этому посту и видео: ССЫЛКА (установка заключается в банальной распаковки архива)
Обновите ComfyUI файлом: oX-UPDATE-comfyui-with-simbolic-link-models.bat
или update\update_comfyui.bat (если нет символических ссылок).
2. Qwen_image_fp8_e4m3fn: СКАЧАТЬ (20гб) 3. Qwen_2.5_vl_7b_fp8_scaled: СКАЧАТЬ (9,4гб) 5. Lora qwen_image_diffsynth_distill: ССЫЛКА Все варианты этих lora: ТУТ
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_fp8_e4m3fn.safetensors
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ └── 📂 loras/
│ └── qwen_image_diffsynth_distill_lora_extract_rank128_bf16.safetensors
6. Установите узлы Pollination по ссылке через Manager - Install via Git URL
и нажмите Install и потом Restart.
Установленные узлы подгрузят новые семплеры и планировщики, которые будут доступны даже в базовых ksamplers.
8. Эта схема только для Lora qwen_image_diffsynth_distill
(png содержит схему, закиньте его в рабочее пространство)
----------------------------------------------------------------------------------
----------------------------------------------------------------------------------
БОЛЕЕ БЫСТРАЯ И КАЧЕСТВЕННАЯ СХЕМА (V3)
1.❗Обязательно обновите ComfyUI иначе будет генерировать дичь.
2. Установите правильные узлы GGUF.
Install via Git URL - вставьте ссылку https://github.com/city96/ComfyUI-GGUF.git и нажмите Enter.
Если под таким именем стоят другие узлы удалите папку ComfyUI-GGUF из custom_nodes. И потом заново их установите.
4. Модели GGUF, если мало видеопамяти: ССЫЛКА
Потребление VRAM:
FP8 (21.8 Гб VRAM)
Q4 (15.4 Гб VRAM)
Q5 (17.1 Гб VRAM)
Q6 (20 Гб VRAM)
Q8 (23.2 Гб VRAM)
Сравнение по качеству этих моделей: ССЫЛКА
5. Схема V3.1 универсальная для FP8 и GGUF:
Эта схема только для Qwen-Image-Lightning-4steps-V1
ДОПОЛНИТЕЛЬНЫЕ ССЫЛКИ
1. Набор художников и стилей
2. Тесты художников и стилей в png картинках 3. ✔️Qwen Image online бесплатные генерации: ССЫЛКА 4. Официальная страница Qwen в Huggingface: ССЫЛКА
🔥 Курс по "AUTOMATIC 1111" с поддержкой на сайте: ССЫЛКА 🔥 Курс по "ComfyUI" с поддержкой на сайте: ССЫЛКА 📺Присоединиться к стримам (+архив): ССЫЛКА