緒山まひろさんでZ-Image-BaseとSDXLを検証
使用したAI
その他
VRAM16GBに乗せ換えたので、今まで使っていたSDXLと他のベースモデルを検証。FLUX1は表現規制が強すぎて、検証中に萎えて止めました。
--------------
【検証1】複数体LORA表示でディテールが混ざる問題
SDXL :プロンプトだけでの対策はできなかった。
Z-IMAGE-BASE:「RIGHT CHARACTER:」などのブロック分けが効果あり、ほぼ混ざらない。が、パラメータ設定ミスなどで崩壊する。(1枚目の画像)
【検証2】箒など長物が体に隠れた場合、出先がずれる問題
SDXL :20枚中9枚で発生※ズレ発生画像 (2枚目の画像)
Z-IMAGE-BASE:20枚中2枚で発生。 (3枚目の画像)
--------------
【SDXL】
lora作成:2500step 45分
画像生成:潜在空間アップスケール付き 1枚出力 50秒
【Z-Image-Baze】
lora作成:2000step 4時間
画像生成:Step圧縮版+アップスケール付き 1枚出力 3分 (未圧縮版は5分以上)
--------------
Z-Image-Bazeは、プロンプト理解力が段違いで空間認識能力も高いが、ゴリゴリにチューニングしても、LORA作成と画像生成の時間が難点。まだ、checkpointも少ない。
結果、多少不都合あっても、ponyやIllustriousなどのチェックポイントがそろっているSDXLが今は最強!
--------------
【検証1】複数体LORA表示でディテールが混ざる問題
SDXL :プロンプトだけでの対策はできなかった。
Z-IMAGE-BASE:「RIGHT CHARACTER:」などのブロック分けが効果あり、ほぼ混ざらない。が、パラメータ設定ミスなどで崩壊する。(1枚目の画像)
【検証2】箒など長物が体に隠れた場合、出先がずれる問題
SDXL :20枚中9枚で発生※ズレ発生画像 (2枚目の画像)
Z-IMAGE-BASE:20枚中2枚で発生。 (3枚目の画像)
--------------
【SDXL】
lora作成:2500step 45分
画像生成:潜在空間アップスケール付き 1枚出力 50秒
【Z-Image-Baze】
lora作成:2000step 4時間
画像生成:Step圧縮版+アップスケール付き 1枚出力 3分 (未圧縮版は5分以上)
--------------
Z-Image-Bazeは、プロンプト理解力が段違いで空間認識能力も高いが、ゴリゴリにチューニングしても、LORA作成と画像生成の時間が難点。まだ、checkpointも少ない。
結果、多少不都合あっても、ponyやIllustriousなどのチェックポイントがそろっているSDXLが今は最強!
呪文
入力なし