見出し画像

第24回、Image to Imageで画像生成(バナナと魚、配置) @Bing+プロンプト

Image to Image でCopilotのチャット機能により、自作のCG画像を参照させて、AI画像を生成しました・・・その時の手順を投稿します・・・

・・・流れとしては・・・自作の画像ファイルを用意して・・・その画像ファイルをEdgeのCopilotにアップロードします・・・チャット機能を使って画像生成を頼みます・・・するとCopilotが画像生成用のプロンプトをImage Creatorに転送します・・・そしてImage CreatorがAI画像を生成する・・・そういう流れです・・・

CGソフトで次のイラストを描いて、PCのハードディスクに保存した
使用画材:ArtRage 5(アンビエント社)
保存形式:Jpeg

・・・そして、Edgeを立ち上げてCopilotを呼び出し、このイラストを参照画像としてCopilotにアップロードしました・・・会話のスタイルは『より厳密に』を選択しています・・・

(アップロードの方法は、Copilotのプロンプト欄の『画像を追加します』アイコンをクリックして現れるダイアログで、『このデバイスからアップロード』をクリックすると、別のダイアログが現れるので、保存した画像を選択してアップロードします)

・・・アップロードの後、Copilotのプロンプト欄に『追加した画像を分析してください.赤い四角と青い四角の位置を認識できますか?』と記述して送信したら・・・

・・・『はい、赤い四角と青い四角の位置を認識できます。赤い四角は画像の上部に、青い四角は下部に位置しています。これらは白い背景に対して明確な視覚的なコントラストを示しています。この情報がお役に立てば幸いです。他に何かお困りのことがありましたら、お知らせください。よろしくお願いいたします。』と回答して来ました・・・

・・・上下は認識したようだが左右は認識できてないと思ったけど、取り敢えず『赤い四角の位置にバナナを描き、青い四角の位置に魚を描いて、AI画像を生成してください.水彩画のスタイルで画像を生成してください.』と返事を送ったら・・・数十秒後に次の画像を生成しました・・・

AI生成画像です
画像生成:Image Creator from Designer

プロンプト:
A watercolor style painting with a banana at the top where the red square was and a fish at the bottom where the blue square was.

・・・生成画像のひとつをクリックすると、Designerがブラウザに読み込まれて大きな画像で表示されます・・・そこには上記のプロンプトがありました・・・Copilotが参照画像を解析して作成したプロンプトです・・・

・・・意味は・・・水彩画のスタイルの画像、赤い四角が存在していた上部にバナナを、青い四角が存在していた下部に魚を・・・大体そんな感じ・・・

・・・生成画像を見ると、左に赤い四角を描いて右に青い四角を描いたものが3枚あり、上に赤い四角で下に青い四角のが1枚・・・位置関係を理解しているような・・・バナナと魚はテキトウに配置しているように見える・・・やっぱり理解してないのかな、どうかな・・・

・・・Copilotの作成したプロンプトを見ると・・・「where the red square was」と過去形になってるから、生成画像には赤い四角が存在しないことを意味するはずだが、赤い四角が生成されている・・・青も同じ・・・これから推測すると、Image Creatorはプロンプトをキチンと理解できてないような気がする・・・もしくは、名詞が書かれていれば適当に画像変換してしまう・・・判らんけど・・・

・・・僕の意図も赤と青の四角は位置を示すためのダミーだったんだけど・・・生成画像には描かれないと思っていたんだけど・・・位置関係を伝えることができると思ってたんだけど・・・無理だったか・・・ん-・・・

この記事が参加している募集

404美術館

英語がすき