春旅 with 仔猫《Stable Diffusion XL版》

使用したAI Stable Diffusion XL
金・土の交流会&懇親会と日曜のエキタグ遠征のダメージが蓄積してて、まだ本調子じゃないけど投稿。
いや、予想以上にダメージ受けてたんですよね。主に足。それと脚。
昨日行ったユーカリが丘線とか運行間隔が20分おきで、駅間が短い(数百メートル)のところが多いので「歩いた方が早い」
ってなるわけですよ。道なりに歩くと遠回りな1区間を除いて。そのせいであの路線だけは徒歩攻略したのが8割くらい。
だって単線で1周するから、到着を待ってる時間がもったいないし。
あと「乗り換えで1本乗り逃したら何も無い『陸の孤島』で40分ひたすら待たなきゃいけない」って切迫した状況に追い込ま
れた成田空港(芝山鉄道)でも地下通路ダッシュしましたけど。
気になる方は趣味であちこちの路線を回ってる人が写真付きで紹介してるので、検索して探して下さい。
マジで「8番出口」みたいな無機質で代わり映えのない景色の地下通路でした。

交流会・懇親会は間に1人の友人・知人・先輩後輩を挟んで繋がりのある人も多かったです。バンナム関係とかアニメとか、
ゲーム・作家周りではサイトウケンジとも会いました。共通の友人・知人は10人以上いるのに、直接会ったのは実は今回が
初めて。まあ「業界あるある」なんですが。

投稿分は18日の「春旅 with 仔猫」のStable Diffusion XL版です。事前に作ってはあったんだけどね。
基本のプロンプトは同じですが、線路に対して真横を向く構図がかなり頻発していたので、BREAK構文で区切られた5段落目に
「((windows are parallel to the direction of the rails:1.5))」を(初期に生成した1~2枚目以外で)追加しています。
「窓は線路の方向と平行している」ってわざわざ指定しなきゃいけないとか……。
Euler aとDPM++ 2M Karrasで数枚作ってみて「やっぱおかしい」となって追加したため、全部ではないですけど。
それでもやはり横を向くのが多くてね、大元の学習モデルからどうにかしてもらわない限り駄目なのかも。


<モデル・パラメータ等詳細>
モデル:XL-VXP Prototypes VXP-C3ILe (商用利用可能)
LoRA:なし

   1枚目 Sampling Steps:21  Sampling Method:DPM++ 2M Karras  CFGスケール:5.7
       Seed:621674277328384

   2枚目 Sampling Steps:14  Sampling Method:Euler a  CFGスケール:2.5
       Seed:5172167113631599

   3枚目 Sampling Steps:22  Sampling Method:DPM++ 2S a Karras  CFGスケール:5.5
       Seed:8302517126790590
   4枚目 Sampling Steps:22  Sampling Method:DPM++ 2S a Karras  CFGスケール:5.5
       Seed:7687139108526811

   5枚目 Sampling Steps:21  Sampling Method:DPM++ SDE Karras  CFGスケール:5.7
       Seed:122314173666057

   6枚目 Sampling Steps:22  Sampling Method:DPM++ 2M SDE Karras  CFGスケール:6.3
       Seed:2217014276446564

   7枚目 Sampling Steps:15  Sampling Method:DDIM  CFGスケール:4.8
       Seed:428493626381128
   8枚目 Sampling Steps:17  Sampling Method:DDIM  CFGスケール:4.7
       Seed:8032978260409121


今回はLoRAを一切使わずに生成してみたのと、珍しくSampling MethodにDDIMも使ってみました。
LoRAで制御すればもっと背景周りが良くなったかもね。

DDIMとはなんぞや? って人も多いかと思うので一応簡単に。
ちちぷいの生成機能・UL生成機能ではサンプラー(Sampling Method)に表示されないので聞き慣れないかも知れませんが、
「Denoising Diffusion Implicit Models」という「ノイズから画像を生成する過程で、効率的かつ高品質にノイズを除去する
手法として設計」されたサンプリング手法です。Stable Diffusion触ってる人なら分かる人も多いかな?

DDIM自体は2020年後半くらいからStable Diffusionの初期段階のサンプラーとして実装され、現在も使われています。
メリットは「高速、決定論的で生成結果が安定している、画像修正に向いている」あたりでしょうか。
デメリットは「最新のDPM++系サンプラーと比較すると同じステップ数でも画質が劣る場合がある」もしくは「少し時代
遅れになりつつある」との評価がされることもあります。
ただ、実際使ってみた印象としては「待ち時間に別の作業してるなら『そんなこまけぇこたぁいいんだよ』って感じ」です。
画像が生成されるまで常時張り付いてなければいけないわけでもなし。

主な特徴としては次のような内容が挙げられます。
 1.効率的な生成(少ないステップ数)
   DDIMは、DDPM(Denoising Diffusion Probabilistic Models)という手法を改良して、少ないサンプリングステップ
   数(Steps)でも高品質な画像を生成できるように設計されました。
   比較的短時間で画像を描き出したい場合に適しています。
 2.決定論的なプロセス(Deterministic)
   同じシード値(Seed)、同じプロンプトを使用すれば、ステップ数やパラメータを変更しても生成される画像の構造
   が大きく変化しにくい特性があります。中間プロセスが固定されているためです。
 3.画像生成の再現性
   プロセスが決定論的であるため、異なるステップ数で生成された画像の構成を比較したり、同じ構図で細部だけを
   調整したりする(Inpaintingやi2i~Img 2 Img)にも適しています。
 4.特徴的な仕上がり
   Euler a などのランダム性の高いサンプラーと比較すると細部まで描き込む傾向があり、またシャープでしっかりと
   したイラストに仕上がる傾向があります。

短時間で画像を生成したい時などは、 少ないステップ数(例:20~30)でも崩れにくいです。
実際7~8枚目はステップ数20を下回ってる状態で作ってますが、他Sampling Methodと比較しても極端に崩れてはいません。

画像の構成を維持したい時は、Img2ImgやInpainting機能を使用して、画像を修正する際に前回の生成画像と構成を合わせ
やすいため、DDIMがよく使われます。
また安定した結果が欲しい時、 ランダム性の高いサンプラーで画像が安定しない場合は、DDIMを使用すると安定する場合が
あります。
要するに「TPO次第ではこのサンプラー(Sampling Method)と合う画像もあるよ」ってことですね。
単純に言うなら「輪郭がはっきりする画像を作るならおすすめできるかも」くらい。絶対とは言いません。

現在の主流は高速(少ステップ数)で高品質半画像を作りやすい「DPM++ 2M Karras」らしいですが、安定感があって、特定
の設定下でのテストや画像編集に強いDDIMも未だに根強い人気があるようです。
Euler aが比較的シンプルめの画像になるのに比べると、DDIMやDPM++系は「細部まで描いてくれて良い感じのイラスト
に仕上がる」「高速」という印象・感想が多いみたいですね。速度だけなら「DDIM<DPM++系」らしいですが。

でもね、個人のマシンじゃそこまでの速度差は意識するほどのものでもないんですよ。究極的には「画像ができればそれで
いい」ってのが結論ではあるので。
古めの手法でも安定しているものはあるんだよ、くらいに捉えてもらえれば。


【追記】
2026年4月20日のStable Diffusion XLデイリーランキング12位いただきました。ありがとうございます。

呪文

呪文を見るにはログイン・会員登録が必須です。

イラストの呪文(プロンプト)

jacket partially removed, heart in eye, burnt clothes, holding fishing rod, kanji, doujin cover, pentagram, tape gag, adjusting headwear, red socks, friends, cloud print, coke-bottle glasses, oral invitation, competition school swimsuit, barbell piercing, gradient legwear, prisoner, blood on breasts, wind chime, carrying over shoulder, tape measure, flaming weapon

イラストの呪文(ネガティブプロンプト)

jacket partially removed, heart in eye, burnt clothes, holding fishing rod, kanji, doujin cover, pentagram, tape gag, adjusting headwear, red socks, friends, cloud print, coke-bottle glasses, oral invitation, competition school swimsuit, barbell piercing, gradient legwear, prisoner, blood on breasts, wind chime, carrying over shoulder, tape measure, flaming weapon
  • Steps 21
  • Scale 5.7
  • Seed 621674277328384
  • Sampler DPM++ 2M Karras
  • Strength
  • Noise
  • Steps 21
  • Scale 5.7
  • Seed 621674277328384
  • Sampler DPM++ 2M Karras

新島 隆治(user_jopgdw44…さんの他の作品

新島 隆治(user_j…さんの他の作品


関連AIイラスト

新着AIイラスト

すべてを見る