見出し画像

DALL・Eの魔法:プロンプトの工夫で楽しむ画風の変化」

Power AppsとChatGPTを連携させて業務効率化を図る勉強をしています。その一環として、画像生成AI「DALL・E」をAPI連携で活用するアプリを作りました。カスタムコネクタの設定には、以下のYouTubeのチュートリアルを参考にしてなんとか完成しました。

しかし、全くプロンプト通りに作れない。面白くない。そこで「DALLE 呪文」とググると、私と同じような悩みを抱えつつも、そこから脱却した人のブログを見つけました。

戦時中のプロパガンダ・ポスターをプロンプトに組み込むことで、キャラクターに動きを出すというものです。私は、世界的に有名な日本のポスターを組み込んで試してみました。それが、表紙のイラストで、左側が「某アニメ作成」で右側が「ビール会社」のものです。ポスターの記述以外はほぼ同じプロンプトですが、全く雰囲気が違います。

ちなみにプロンプトは以下の通りですが、「 」は実際のものと異なります。


「1910s  「ビール会社名」Beer advertisement poster of kawaii cute girl 「キャラクタ名」,ranking number 1 in 「画像投稿SNS名」,4K,HD,wallpaper,beautiful iillustration.masterpiece.」


1、問題提起

この制作過程で気になった点を検証しました。

1)プロンプトに記述した年代を変えるとどうなるか?
2)ブラウザとAPIで結果が異なるか?
3)キャンバスサイズで結果の違いは? 512×512と1024×1024の違い。

気になりませんか?私は気になります。
そこで以下のような方法で検証しました。

1、1910年から2020年までの10年毎と、3000年代をそれぞれ作成。
2、年代毎にブラウザとAPIのサイズ違いを2つを作成。

2、作品比較


いずれも同じプロンプトを入れて、DALLEで作成しました。元ネタがあるので、2時利用はお控えください。
左からブラウザ、API(512×512)、API(1024×1024)となっています。


1910年代
1920年代
1930年代
1940年代
1950年代
1960年代
1970年代
1980年代
1990年代
2000年代
2010年代
2020年代
3000年代

3、考察


①年代別
年代で作品を比較すると、ブラウザもAPIも、古い年代のポスターは淡くくすんだ色合いで、古いポスターを思わせる画風でした。一方、新しい年代は、描写が細かく、ゴージャスな作風になっています。また、ブラウザの作品では、作風の変化が緩やかでしたが、APIの場合は、早い段階で現代風の作風に切り替わりました。このことから、作品にその年代の画風を求めるなら、ブラウザの方が希望に沿う傾向があることがわかりました。

②ブラウザとAPI
ブラウザは全年代を通して水彩画のようなタッチで一貫性がありましたが、APIの作風は幅が広い傾向にあるようです。

③キャンパスサイズの違い

実は、プロンプトには以下のような記述を追加しています。これを指定することで、サイズと顔の描写をある程度固定できるからです。
そのおかげか、キャンパスサイズによる違いは見られませんでした。


From the waist to the top of the head.
The face features slender eyebrows, a pointed chin, a small nose, thin lips, fair skin, slightly large eyes, and high cheekbones. The face has a round shape, expressive and lively facial expressions, a cute smile, and emotive expressions that sync with the music. Additionally, there is a black headset microphone on the face.


④ その他

プロンプトに”黒いヘッドフォンを着用”と記述しましたが、全39枚中登場するのは2回でした。この検証の前段階で作ったものを合わせると、100枚以上作成しているので、ヘッドフォンの登場確率は2%以下となります。考えられる要因として、プロンププトの最後の方に記述していたせいだ思います。ヘッドフォンを確実に着用させたいなら、最初の方に記述する必要がありそうです。
また、ほとんどの作品に瓶ビールらしきものが登場しますが、たまに缶ビールだったり、登場しなものもありました。ビールのポスターなのに不思議です。

証結果から、ブラウザとAPIの違いや年代ごとの画風の変化などが見られました。どの作風も可愛く、味のあるものになりましたが、個人的には、2020年代の作品が一番好きです。今回の研究を通して、DALL・Eを活用する上での工夫や、さらなる可能性を発見できたと思います。

(タイトルや本記の一部は、ChatGPTを活用しています)


この記事が気に入ったらサポートをしてみませんか?