見出し画像

DALL-Eで絵本を作る試み・・・

 これは、ChatGPT DALL-Eのプロンプトのgen_idを取得したり、JSON形式でプロンプトを出力させて、背景などを可能な限り変更しない状態のまま、主人公の表情や動きを変えるために行う専門的な方法を選ばず、ただ、日本語だけで主人公の動きをシミュレートできるかの実験を試みた。

 要は、英語のプロンプトを無視して、「背景の壁や藁、親鳥などのプロンプトを固定して変更してはならない」といった日本語で牽制しながら、こちらが要望する画像についての日本語説明がDALL-Eに伝わり、どこまで忠実に生成できるかの実験である。ただし、アスペクト比は、常に「--ar 16:9」は日本語説明文の最後に付加しておいた。

 主人公は縞模様の子猫と親友のヒヨコである。

 事始めに、子猫が友人となったヒヨコの頭を撫で撫でする動きを注文づけたのだが、うまい具合に子猫はヒヨコの頭に優しく右前足を乗せて、撫で撫でしている。実は、2枚の画像(トップ画像と下の画像)が生成されたので、1枚目が生まれたてのヒヨコのようで、それを採用することにした。

 次に、子猫の成長を止めた環境下で、1羽のヒヨコだったのが、気づけば親鶏たちが次から次に卵を産んで、一気にヒヨコが増えるというストーリーをDALL-Eに伝え、段階を踏んで画像生成を続けて行くことにした。

 子猫は最初に出逢ったヒヨコを頭上に乗せて遊んでいる。周囲には卵がコロコロと転がっている。背後からは親鶏が様子を伺っている。

 大量の卵が床にコロコロとあり、子猫は逆立ちしたりして驚きの気持ちを表している。だんだんと賑々しくなる田舎の鶏小屋の中。

 3週間ほど経てば、子猫の周りにあった卵から次々にヒヨコが生まれ、驚いた子猫が飛び上がっている様子の画像が生成される。

 最後の画像は、最初の友人となったヒヨコが成長した姿(およそ5ヶ月後)に変わり、成長しないを条件としていた子猫は、その背中に乗せてもらって遊んでいるという流れである。

 結論を申し上げれば、DALL-Eを操るのに、冒頭のように専門的なプロンプト修正不可の作業を行わずとも、ある程度は同じ環境下で、主人公の動きをコントロールできることが分かった。多分、生成AIの多言語化と理解度、推量能力が長けており、日本語で諄いほど注文をつければ、それに対応できるのであろうと推察する次第。

 何はともあれ、AI専門家を目指さず、日頃からAIを友達感覚で利用する人には、すこぶる素晴らしくイージーなヒューマンインターフェイスではなかろうかと、感心したのであった。

撫で撫で
子猫の頭の上にヒヨコが乗って遊ぶ
周囲に数個の卵
卵の数に驚き逆立ちする子猫
一気に生まれた多くのヒヨコにジャンプで驚きを表現する子猫
最初のお友達のヒヨコの背中に乗せてもらい遊ぶ子猫

サポート、心より感謝申し上げます。これからも精進しますので、ご支援、ご協力のほどよろしくお願いいたします。