GPT-image-1.5のテストを続けています。
キャラクターデザインリファレンスの画像参照(i2i)で生成。

おどいたのは、この顔のサイズでも「ある程度の精度」で描写されていることです。image-1だと荒れていたでしょう。
背景を生成して、人物だけ大きいサイズで生成して縮小レイヤー合成するという面倒くさいことをしなければならなかった。

2枚目は「日本語でざっくり指示」で生成したのですが、逆走車両が出てきました。
スレッドを立て直して、追い込み(英語思考でラベル化、デビルズアドボケイトモードで評価し再構成)をかけたところ、きちんと正面(1枚目)になりました。

ちなみに、Gpt-image-1.5 Prompting Guideというのをみつけたので、GPT-Projectsでテキスト参照かけ、ラベル化するときに効くように指示しています。効いているかどうかは不明です。以前は、GPTで画像生成に関する論文を探して、ラベル化するときに参照させていました。中身がブラックボックスなので、おまじないみたいなものです。
https://cookbook.openai.com/examples/multimodal/image-gen-1.5-prompting_guide

呪文

入力なし

郷土通信さんの他の作品

郷土通信さんの他の作品


新着AIイラスト

すべてを見る