見出し画像

呪文(プロンプト)は万能ではない

呪文(プロンプト)は万能ではありません。声高に「裸」!と叫んでみても裸の絵に書き換えてはくれませんし「制服」!と叫んでみても元の絵が制服に近いものではなければなかなか制服を着た絵には変化しません。

ここでいう「叫ぶ」とは「(制服:2.2)」や「(((制服)))」のような特定の呪文の効果を強めることを比喩して表現しています。

まず、()なしの効果を1とすると、一重の()ありの効果は1.1です。二重の括弧つまり(())で囲んだ効果は1.1*1.1=1.21となり、三重括弧は1.1の3乗で1.331となります。
つまり(((制服)))は(制服:1.331)であって(制服:3.0)では無いのです。まずこの点を初心者の方は誤解しがちなので押さえておきましょう。

そして、倍率はせいぜい2.0くらいまでにしましょう。これを超えて指定しても絵が変に歪むだけで綺麗な絵にはなりません。実際は1.4上限くらいが良いと考えます。

これを例えば(裸:9)とかやるとどうなるでしょうか。
耳をつんざくほどの大声で「裸にしてくれー!」と叫ばれたところでAIさんは頭爆発、全体がグレー一色のノイズがかったような絵が出力されるのみで裸の人はどこにもいません。

img2img、つまりある画像を元に呪文を指定してAI生成する際にDenoising strengthという、元絵と呪文のどちらに寄せるか、その寄せ具合を表す数値があります。
0〜1.0の値を取るのですがAI.imgやAI2Dでは(分かりやすく)それを100倍したDS(0〜100)という数値で表現しています。
0であれば完全に元絵とほぼ同じ物が、100にすれば元絵をなるべく無視して呪文の影響度を上げたものが、50にすれば元絵と呪文の影響度が半々といった具合です。
100にすれば「元絵なしで呪文だけで生成するパターン、つまりtxt2imgと同じになるということね!」と思いきや、そうではなく、元絵の影響はゼロにはならないようでtxt2imgの生成したものとはあきらかに異なります。

このDSを上げ下げしてみても、呪文をいくら工夫してみても狙った絵にはなかなかなりません。

なぜならimg2imgにおいて
・呪文は最後のディテールを整えてくれるだけ。
・DSを上げれば絵が劇的に変化するが、全体が変わってしまうので狙った絵になるかどうかは結局ガチャになってしまい、元絵を指定した意味が薄れる。
ということだからです。

img2imgでは元画像の等身、ポーズは維持され、ディテールが変化します。特に顔の大きさは変わらないので二次元の画像を元にリアル系モデルにかけると顔が大きい宇宙人系の画像ができあがります。

なら裸にするにはどうすればいいか。

そう、ペイントです。

この絵をどんな感じに裸にしたいか、裸になった際に肌が見える部分を肌色にペイントします。
そのペイントした絵を元絵として、かつ呪文にはもちろん「裸」というワードを入れてimg2imgにかけます。
するとどうでしょう。あんなになかなか脱いでくださらなかった身持ちの堅い姫君が(以下自粛)

また、制服を着せたいのならば同様に、制服を着てるようざっくりでいいので紺色と白とあと、必要ならばスカーフの赤などを絵にペイントしてそれを元絵としてimg2imgにかければOKです。

その際のDS値は35〜50くらいがよいでしょう。
私の場合はいつも35で指定してます。
これでうまくいかない場合は、繰り返しますが、DS値や呪文でどうにかなることはありません。もう少し精密に描くなどペイントで工夫しましょう。

  1. 元絵→ペイントした絵→複製した絵
    の一回のサイクルで全てうまくいかない場合もあるので

  2. 元絵→ペイントした絵→複製した絵→さらにそれを複製

  3. 元絵→ペイントした絵→複製した絵→複製した絵をペイント→複製

    • というように、複製やペイントを繰り返してより完成系に近づけてもいいでしょう。

同じ絵を元に、呪文を変えてみたり、呪文の特定ワードを強めてみたり、DS値を変えてみたりしながら何度も複製を繰り返してしまうのは初心者の方にありがちな例ですが、この状態を脱する方法はなかなか自分では気づきにくいものです。
その知見をはやく皆様にお知らせしたいと思いながらも、説明が大変そうでなかなか今まで記事にできずじまいでした。やっと記事にできて荷が降りた思いです。

また、呪文の指定に20も30もワードをたくさん並べているケースが散見されますが、各ワードの影響具合は相対評価なのでたくさん並べれば並べるほど意図が分散してAIにとって何描いて良いかわからんということになりますし、呪文を人が書き換える際にもたくさん書いてあるとノイズになるだけで修正しづらいです。

おすすめはせいぜい呪文のワードをせいぜい7つくらいに収めることです。

例えば、ロリっぽい子の制服姿のパンチラを描きたい、であるならば

ロリ
制服
パンチラ
白パン

で十分です。
少し強調したいワードがあればそれをせいせい一つの()で囲むくらいにしましょう。全部のワードを囲んではいけません。それは教科書の全部の文章にマーカーを引くようなものです。

その他テクニックとしては
座ってるはずなのに立った構図になる場合は「座る」
靴下の部分がおかしくなる場合に「白ソックス、紺ソックス」
靴の部分がおかしくなる場合は「黒靴」
などを入れると良いです。
特に座っている構図ならひとまず「座る」を入れておくというテクを私はよく使います。

とにかく大声とたくさんの呪文でなんとかしようという考えは脱して、呪文は最後の仕上げくらいに捉え直し、ペイントであなたの意図を優しく伝えてあげてください。

もう少し色々とお伝えしたい点があるので後でさらに記事に加筆修正いたします。

私のウェブサイト

AI2Dの無料トークンが今だけ使えます

二次元版Ai.imgとなるAI2Dをリリースしました。
今の期間のみ使用できるトークンを下記の通り無償にてご提供致します。

⚫︎トークン
202311_startAi#2DDDDD

動作が安定次第、無料期間を終了させていただく予定です。ご了承ください。


AI.img

キャッチ画像の全体図(おまけ)


画像の切り取りとペイントと複製をうまく繰り返していくとこんな素敵な画像が完成します。
呪文はスラムダンクで言うところの「左手は添えるだけ」の添える左手のようなものです。無いと困るけどそれだけでなんとか出来るものではありません。

この記事が気に入ったらサポートをしてみませんか?