画像生成AIで、「ケンタウロス少女」を作る実験結果(画像生成AIは出力が極端に苦手な物がある)

せっかく人工知能が出たので、「何か、ラノベ的な世界感のもの」を作ってみようと思って、画像生成AIで、アイデアのネタ探しをしている段階ですが、現在、「モンスター娘」が、「兎耳少女」1人だけなので、今度は、ケンタウロスを作ってみようと思った。
というのも、そういう処理が人工知能ができるのか?が気になったから。
結論を書くと、
・画像生成AIは出力が極端に苦手な物がある。
という事がわかって、「ケンタウロス少女」は、なかなか出てきてくれない。
以下が、「ケンタウロス少女」のプロンプトを作ろうと思って、いろいろと実験した結果です。
使っているのは、Bing Image Creator(中身は、DALL·E)。

(実験結果)
(1)
まず、最初に今回自分が出力したいイメージは、
・『RPGゲームのケンタウロス少女で騎士で鎧を着ている』
という主題からスタートした。
「プロンプト」と、その「プロンプトのGoogle翻訳」の順番で書いて、「結果と問題点」を書いていく。

(1~3)
A centaur girl in a RPG game. She has the upper body of a human and the lower body of a horse. She has long brown hair and green eyes. She wears a silver armor that covers her chest, shoulders, arms, and legs. The armor has intricate patterns and symbols on it. She holds a sword in her right hand and a shield in her left hand. She looks brave and dignified. She is standing on a grassy field with mountains in the background.

RPGゲームに登場するケンタウロスの女の子。 上半身は人間、下半身は馬の姿をしている。 彼女は長い茶色の髪と緑色の目をしています。 彼女は胸、肩、腕、足を覆う銀色の鎧を着ています。 鎧には複雑な模様やシンボルが描かれています。 彼女は右手に剣、左手に盾を持っています。 彼女は勇敢で威厳があるように見えます。 彼女は山を背景に草が茂った野原に立っています。

(出力画像)

(結果と問題点)
「She has the upper body of a human and the lower body of a horse.(彼女は上半身が人間で下半身が馬の姿をしています。)」と書いているのに、「なぜか?馬の顔に人間の胴体」という逆の状態の画像で出力される事が多い。
ケンタウロスっぽくなっても、「ほぼ人間にしか見えない」ようなインチキ構図になっている。

(4,5)
A centaur girl in a RPG game. She has the upper body of a human and the lower body of a horse. She has girl face long brown hair and green eyes. She wears a silver armor that covers her chest, shoulders, arms, and legs. The armor has intricate patterns and symbols on it. She holds a sword in her right hand and a shield in her left hand. She looks brave and dignified. She is standing on a grassy field with mountains in the background.

RPGゲームに登場するケンタウロスの女の子。 上半身は人間、下半身は馬の姿をしている。 彼女は女の子のような顔の長い茶色の髪と緑色の目をしています。 彼女は胸、肩、腕、足を覆う銀色の鎧を着ています。 鎧には複雑な模様やシンボルが描かれています。 彼女は右手に剣、左手に盾を持っています。 彼女は勇敢で威厳があるように見えます。 彼女は山を背景に草が茂った野原に立っています。

(出力画像)

(結果と問題点)
「girl face」ときちんと明記する事にした。
しかし、「馬の顔に人間の体」が相変わらず出る。
逆のパターンの出力の時には、「girl face」と書いた事で、逆に、「ほぼ人間にしか見えない」という、ケンタウロス感が消えてしまった。
「馬の顔」を見ると、「可愛らしい女の子の馬の顔」をしている事から、「girl face」というのが、「馬の女の子の顔」と人工知能が思っているらしい。

(6~8)
A centaur girl in a RPG game. She has the upper body of a human and the lower body of a horse. She has human girl face long brown hair and green eyes. She wears a silver armor that covers her chest, shoulders, arms, and legs. The armor has intricate patterns and symbols on it. She holds a sword in her right hand and a shield in her left hand. She looks brave and dignified. She is standing on a grassy field with mountains in the background.

RPGゲームに登場するケンタウロスの女の子。 上半身は人間、下半身は馬の姿をしている。 彼女は人間の女の子のような顔の長い茶色の髪と緑色の目を持っています。 彼女は胸、肩、腕、足を覆う銀色の鎧を着ています。 鎧には複雑な模様やシンボルが描かれています。 彼女は右手に剣、左手に盾を持っています。 彼女は勇敢で威厳があるように見えます。 彼女は山を背景に草が茂った野原に立っています。

(出力画像)

(結果と問題点)
前回が、「girl face」だけだったので、「馬の女の子の顔」と人工知能が解釈している可能性があるので、きちんと、「human girl face」と明記した。
だが、相変わらず、「馬の顔に人間の体」の状態で出るし、逆のパターンになると、「ほぼ人間」になってしまった。

(9,10)
A centaur girl in a RPG game. She has the upper body of a human and the lower body of a horse. She has girl face & long brown hair and green eyes. She wears a silver armor that covers her chest, shoulders, arms, and legs. The armor has intricate patterns and symbols on it. She holds a sword in her right hand and a shield in her left hand. She looks brave and dignified. She is standing on a grassy field with mountains in the background.

RPGゲームに登場するケンタウロスの女の子。 上半身は人間、下半身は馬の姿をしている。 彼女は女の子の顔と長い茶色の髪と緑の目を持っています。 彼女は胸、肩、腕、足を覆う銀色の鎧を着ています。 鎧には複雑な模様やシンボルが描かれています。 彼女は右手に剣、左手に盾を持っています。 彼女は勇敢で威厳があるように見えます。 彼女は山を背景に草が茂った野原に立っています。

(出力画像)

(結果と問題点)
「She has human girl face long brown hair and green eyes.」と、つながって書いているのがまずい気がしたので、「She has girl face & long brown hair and green eyes.」のように、&記号で区切りを入れた。
が、「ほぼ人間」になってしまった。

(11~13)
A centaur girl in a RPG game. She has the upper body of a human and the lower body of a horse. She has girl face & long brown hair. She wears a silver armor that covers her chest, shoulders, arms, and legs. The armor has intricate patterns and symbols on it. She holds a sword in her right hand and a shield in her left hand. She looks brave and dignified. She is standing on a grassy field with mountains in the background.

RPGゲームに登場するケンタウロスの女の子。 上半身は人間、下半身は馬の姿をしている。 彼女は女の子の顔と長い茶色の髪を持っています。 彼女は胸、肩、腕、足を覆う銀色の鎧を着ています。 鎧には複雑な模様やシンボルが描かれています。 彼女は右手に剣、左手に盾を持っています。 彼女は勇敢で威厳があるように見えます。 彼女は山を背景に草が茂った野原に立っています。

(出力画像)

(結果と問題点)
「green eyes(緑色の目)」という色の指定に引っ張られるようで、騎士の鎧の色とかに、「緑色」が混ざりやすい傾向が出て変だったので、「green eyes(緑色の目)」を削除した。
なぜか?「ほぼ人間」か「ほぼ馬」ばかり出るようになった。

(14~17)
An anime-style centaur girl with long blonde hair and blue eyes, smiling and holding a bow and arrow, in a forest

森の中で微笑みながら弓矢を持っている、長いブロンドの髪と青い目をしたアニメ風のケンタウロスの女の子

(出力画像)

(結果と問題点)
「ケンタウロス」状態自体が安定してまだ出ていないのに、「騎士の鎧を着ている」とか、細かい指定が多すぎたのが、まずかったと思ったので、最低限の記述だけに変えてみた。
結果は、「胸像」部分のみになり、かなりインチキ感が強い。
「ケンタウロス」に見えなくもないが、ほぼインチキ。
ただ、さっきまでと違って、「馬の顔に人間の胴体」という状態は消えた。

(18~21)
An anime-style centaur girl with long blonde hair and blue eyes, smiling and holding a bow and arrow, in a forest. She has the upper body of a human. and the lower body of a horse.

長いブロンドの髪と青い目をしたアニメ風のケンタウロスの女の子が、森の中で弓矢を持って微笑んでいます。 彼女は人間の上半身を持っています。 そして馬の下半身。

(出力画像)

(結果と問題点)
「She has the upper body of a human. and the lower body of a horse.(彼女は人間の上半身を持っています。 そして馬の下半身。)」ときちんと明記して付け加えた。
結果はだいぶましになった。
「ケンタウロス」っぽくなってきたが、まだまだ全然ダメな感じ。
最後の画像だけ、ちょっとましになった気がする。
ギリギリ使えそうなラインには入ってきた。

(最終結論)
結論を書くと、
・画像生成AIは出力が極端に苦手な物がある。
「ケンタウロス」のように普通の形状で無い物は、画像生成AIは物凄く苦手なようです。

この記事が気に入ったらサポートをしてみませんか?