プロンプト考察
使用したAI
ChatGPT
キタシンさんの『ガリガーリーの小さな女の子』の6枚目
https://www.chichi-pui.com/posts/8ee981b3-43f6-4972-a573-f3495cfc07a6/
明らかに絵柄の違うこの1枚が如何にして出力されたのか検証してみた。
まず想定されるのはモデルデータが違うこと。
ちちぷいでもDAISYさんとECHIDNAさんではまったく絵柄が異なるため一番ありえそうだったのだけれど
ChatGPTさんにはモデルデータが一つしかないとのこと。
つまり指示された文章(日本語プロンプト)から自動的に適したモデルに変更しているといった事は無いらしい。
キタシンさんの他のChatGPT生成イラストを見ていても安定しているので、言われてみればそれはそう。
なのでまず今回のキタシンさんの使用プロンプトを分解、どれが何クラスタに所属しているかを分析し
どの学習イラスト群に引き寄せられているかを考察することにしました。
結果はガーリー、ゆるふわ、ふわふわ、可愛いなどの語句が容姿、服装、雰囲気と同時に
スタイルクラスタに影響を与えていることが判明。
つまり『ガリガーリーの小さな女の子』の6枚目の特長である、ややたれ目で大きい目。眼は顔の下に寄っている。
眼から上が大きい頭部。アゴのラインが鋭角ではない。という少女漫画的特徴が
そのままスタイルクラスタに繋がっている。
ここまでは判明しました。
問題はここから。そのクラスタを仮称できらら系クラスタと呼びます。
きらら系クラスタの影響を強くし、現状のキタシンさんが生成している絵柄から離させる為、まずは萌えアニメという語句を排除。
つぎに5頭身を3~3.5頭身に。
しかしChibiは使用しない事で足の長さを確保します。
結果は失敗ꉂꉂ
普段通り絵柄のまま寄せているだけ感が残り、根本的に違うスタイルになりきりません。
香港で上海蟹を食べたいのに神戸の南京町で中華を食べているような感じ。
これはChatGPTさんがスタイルプロンプトに対応していない為。
明確にスタイルが存在するのに直接指定できないもどかしさ…
ちなみにChatGPTさんの中ではPixiv系ゆるふわイラストらしいですが、そのスタイル指定も受け付けません。
ここでChatGPTさんの画像生成の仕組みを簡単に説明すると一つのキーワードがいくつかのクラスタに登録されており、複数ワードで比重の重くなったクラスタの別の何かが混ざるノイズが発生する仕組みです。
わかりやすく言うなら使用語句によって惑星の重量場が変動し特定の惑星に不時着。そこにあるものでサバイバルする感じ。
とにかく惑星きららに到達することが重要なのがわかりましたので、次の機会には『きらら』っぽいワードを
めちゃくちゃ増やして重力場を強くしてみたいと思います(つづく)
余談。
1枚目がChatGPTさん、2枚目はGeminiさん、3枚目はちちぷい、DAISYさん(きららスタイル)、4枚目は3枚目をいつもの絵柄タグでi2iしたものになります。
https://www.chichi-pui.com/posts/8ee981b3-43f6-4972-a573-f3495cfc07a6/
明らかに絵柄の違うこの1枚が如何にして出力されたのか検証してみた。
まず想定されるのはモデルデータが違うこと。
ちちぷいでもDAISYさんとECHIDNAさんではまったく絵柄が異なるため一番ありえそうだったのだけれど
ChatGPTさんにはモデルデータが一つしかないとのこと。
つまり指示された文章(日本語プロンプト)から自動的に適したモデルに変更しているといった事は無いらしい。
キタシンさんの他のChatGPT生成イラストを見ていても安定しているので、言われてみればそれはそう。
なのでまず今回のキタシンさんの使用プロンプトを分解、どれが何クラスタに所属しているかを分析し
どの学習イラスト群に引き寄せられているかを考察することにしました。
結果はガーリー、ゆるふわ、ふわふわ、可愛いなどの語句が容姿、服装、雰囲気と同時に
スタイルクラスタに影響を与えていることが判明。
つまり『ガリガーリーの小さな女の子』の6枚目の特長である、ややたれ目で大きい目。眼は顔の下に寄っている。
眼から上が大きい頭部。アゴのラインが鋭角ではない。という少女漫画的特徴が
そのままスタイルクラスタに繋がっている。
ここまでは判明しました。
問題はここから。そのクラスタを仮称できらら系クラスタと呼びます。
きらら系クラスタの影響を強くし、現状のキタシンさんが生成している絵柄から離させる為、まずは萌えアニメという語句を排除。
つぎに5頭身を3~3.5頭身に。
しかしChibiは使用しない事で足の長さを確保します。
結果は失敗ꉂꉂ
普段通り絵柄のまま寄せているだけ感が残り、根本的に違うスタイルになりきりません。
香港で上海蟹を食べたいのに神戸の南京町で中華を食べているような感じ。
これはChatGPTさんがスタイルプロンプトに対応していない為。
明確にスタイルが存在するのに直接指定できないもどかしさ…
ちなみにChatGPTさんの中ではPixiv系ゆるふわイラストらしいですが、そのスタイル指定も受け付けません。
ここでChatGPTさんの画像生成の仕組みを簡単に説明すると一つのキーワードがいくつかのクラスタに登録されており、複数ワードで比重の重くなったクラスタの別の何かが混ざるノイズが発生する仕組みです。
わかりやすく言うなら使用語句によって惑星の重量場が変動し特定の惑星に不時着。そこにあるものでサバイバルする感じ。
とにかく惑星きららに到達することが重要なのがわかりましたので、次の機会には『きらら』っぽいワードを
めちゃくちゃ増やして重力場を強くしてみたいと思います(つづく)
余談。
1枚目がChatGPTさん、2枚目はGeminiさん、3枚目はちちぷい、DAISYさん(きららスタイル)、4枚目は3枚目をいつもの絵柄タグでi2iしたものになります。
呪文
呪文を見るにはログイン・会員登録が必須です。
イラストの呪文(プロンプト)
jacket partially removed, heart in eye, burnt clothes, holding fishing rod, kanji, doujin cover, pentagram, tape gag, adjusting headwear, red socks, friends, cloud print, coke-bottle glasses, oral invitation, competition school swimsuit, barbell piercing, gradient legwear, prisoner, blood on breasts, wind chime, carrying over shoulder, tape measure, flaming weapon
イラストの呪文(ネガティブプロンプト)
入力なし