緒山まひろさんでZ-Image-BaseとSDXLを検証

使用したAI その他
VRAM16GBに乗せ換えたので、今まで使っていたSDXLと他のベースモデルを検証。FLUX1は表現規制が強すぎて、検証中に萎えて止めました。
--------------
【検証1】複数体LORA表示でディテールが混ざる問題
SDXL     :プロンプトだけでの対策はできなかった。
Z-IMAGE-BASE:「RIGHT CHARACTER:」などのブロック分けが効果あり、ほぼ混ざらない。が、パラメータ設定ミスなどで崩壊する。(1枚目の画像)

【検証2】箒など長物が体に隠れた場合、出先がずれる問題
SDXL     :20枚中9枚で発生※ズレ発生画像  (2枚目の画像)
Z-IMAGE-BASE:20枚中2枚で発生。 (3枚目の画像)
--------------
【SDXL】
lora作成:2500step 45分
画像生成:潜在空間アップスケール付き 1枚出力 50秒

【Z-Image-Baze】
lora作成:2000step 4時間
画像生成:Step圧縮版+アップスケール付き 1枚出力 3分 (未圧縮版は5分以上)
--------------
Z-Image-Bazeは、プロンプト理解力が段違いで空間認識能力も高いが、ゴリゴリにチューニングしても、LORA作成と画像生成の時間が難点。まだ、checkpointも少ない。
結果、多少不都合あっても、ponyやIllustriousなどのチェックポイントがそろっているSDXLが今は最強!

呪文

入力なし

カゲロアさんの他の作品

カゲロアさんの他の作品


関連AIイラスト

新着AIイラスト

すべてを見る