【StableDiffusion】3Dゲーム系のキャラの叡智画像を作る際の2.5Dとはなんだ?を探求してみる

Stable Diffusion

今回のテーマ

今回はアニメ系のエチエチ画像は作れるようになったけど、3Dゲームっぽいエチエチ画像はまだまだ作り慣れていないピースPが、ゲームっぽい画像とは何かを探求していきます!

2.5Dという感覚をAIに伝えるのは結構難しいと思う

上の画像はライトニングさんがヤラれちゃってる画像ですが、これをどう表現するか迷いませんか?3DCGにも見えるし、写実的な油絵にも見えるし、はたまたUIがあるからゲームの画像にも見えるし、微妙に判断つきづらいですよね。

アニメっぽく、実写っぽくと言われると、どちらがどういう物か、私達もイメージをしやすいのと同様に、AIもアニメというのはどういう物か、実写とはどういう物か判断が付けやすそうに感じます。

一方、3Dのアニメ風キャラの絵、という、なんとも曖昧なものをAIに伝えるのは凄く難しいなと感じています。

ファイナルファンタジーみたいなハイポリ3Dゲームもあるし、Vtuberやギルティギアなどのトゥーンシェーディングの3Dがあったり、昔のローポリゴンの3Dもあるし、blenderなどで作られている3Dのエロアニメもあるし、2次元と3次元の間という幅が凄く広いため、プロンプトを書いている人間側も具体的なプロンプトが書けず、AIも判断に迷うのかなと思います。

兎にも角にも実験だ

今回は2.5次元の中でもリアル系の3Dゲームの雰囲気を目指すべく、まずはそういったジャンルが得意そうなチェックポイントを探してみたところ、良さげな物が見つかりました。

yomama 2.5D

アニメなどの2次元キャラをいい感じに実写化するチェックポイントのようです。

こちらのチェックポイントはベースとなっているチェックポイントがnoob, illustrious, ponyとなっていて、使い慣れているベースモデルから試して見るのが良いと思います。

ピースPは最近animagineからillustriousに変えているので、illustriousをベースにしたモデルを使ってみました。

作者の方が説明欄で、実写寄りにするかアニメ寄りにするかの調整塩梅を説明してくれているので、よく読みましょう。

illustrious系の説明和訳

キャラクターのリアリティは、そのキャラクターのデータによって大きく異なります。例えば、マンガやアニメのキャラクターは3Dゲームのキャラクターに比べてはるかにリアリティに欠けます。リアリティチェックポイントのウェイトを低く抑えることで、既にリアリティのあるキャラクターが静止画にならないようにしましたが、同時にマンガやアニメのキャラクターが若干リアリティに欠けるという欠点も抱えています。その場合は、このv2チェックポイントと非常に相性の良い、リアリティフィルター「lora」と組み合わせてお使いください。

Realistic filter [IL] – IL v1.0 | Illustrious LoRA | Civitai

以下はおすすめ設定

ポジティブプロンプト:
masterpiece, best quality, realistic

ネガティブプロンプト:
worst quality,bad quality,bad hands,very displeasing,extra digit,fewer digits,jpeg artifacts,signature,username,reference,mutated,lineup,manga,comic,disembodied,cropped,amputee,bad foreshortening,what,guro,logo,bad anatomy,bad perspective,bad proportions,artistic error,anatomical nonsense,amateur,out of frame,multiple views, text ( copyright name:1),

サンプラー:
Euler a, DPM++ 2M karras.

CFGスケール:
6-8

解像度:
832×1216

(他の設定も自由に試してみてください。結果が2Dっぽすぎる場合は、アニメローラの重みを下げることができます)

こちらのモデルを使ってリアル系2.5Dを目指す際に、一番大事だと思ったプロンプトは「realistic」です。これを入れないと、アニメやゲームのキャラクターを使う場合、元々illustriousが認識しているキャラクターの風貌がアニメ系として認識されているため、かなり2次元寄りになってしまいます。

realistic無しで生成した画像

realistic有りで生成した画像

結構違いますね。あとrealisticを入れないと、カメラが寄りになります。realisticを入れる事でカメラを遠ざける事が出来るため、3Dゲーム特有の視点が作りやすくなります。

だけどまだまだ油絵感が強いため、さらに調整していきます。

CFGスケールを小さくすることでリアル寄りに寄せられるということなので、上の画像はCFGスケール「5」で出力しましたが、モデル作者様の説明に沿って「2.5」でやってみます。

写実感がアップしました。

だけど、なんか3DCGというよりかはめっちゃ絵のうまいイタリア人が書いたエロ絵みたいに見えてきてしまったので、更に試行錯誤した結果……

それなりにファイナルファンタジーのプリレンダムービーっぽい画像に近づけました。

調整内容

ポジティブプロンプト

realistic, 3d, blender (medium), masterpiece, best quality, amazing quality, dutch angle,

BREAK

1girl,
yuffie kisaragi, final fantasy vii remake, official style, white panties, large breasts, open clothes, thick thighs, wide hips, curvy, restrained, head tilt, defeat, fighting stance, armor, sweat, blush, v-shaped eyebrows, female orgasm, clenched teeth,

BREAK

nsfw, hetero, gangbang, panties aside, small ugly man, hug from side, dry humping, rough sex, grabbing another’s breast, groping motion, user interface, depth of field, factory,


ネガティブプロンプト

worst quality,bad quality,bad hands,very displeasing,extra digit,fewer digits,artifacts,signature,username,reference,mutated,lineup,manga,comic,disembodied,cropped,amputee,bad foreshortening,what,guro,bad anatomy,bad perspective,bad proportions,artistic error,anatomical nonsense,amateur,out of frame,multiple views,


サンプラー:DPM++ 2M
スケジューラ:DDIM
CFGスケール:2.5
ClipSkip:2
サンプリングステップ数:20
解像度:1280×720
高解像度設定:1920×1080(アップスケーラ「Latest」、ステップ数0、ノイズ除去0.6)

あとはやっぱりUIがあるとゲームっぽくなるので「user interface」は入れとくと手軽にゲームっぽくなります。生成舌画像にあとからコラでUI入れるのも良し。

あとがき

今回はプリレンダリングレベルの高精細な3Dゲームっぽい画像になりましたが、リアルレンダリングの微妙にレベルの低い3Dゲームの再現もしてみたいなと思ってます。

それにしても追っても追っても理想は遠く、日々実験ですね。

それでは、みなさんもエチエチ画像を量産して、良いシコシコライフを!

広告
BOOTHでStableDiffusionで使えるワイルドカードやプロンプト集を販売しています。
活動資金の援助だと思って購入してくれると嬉しいです!

コメント

タイトルとURLをコピーしました