［無料です］Bing DALL-E3のプロンプト検証

2023年12月2日 09:17

GPTsクリエーターのAIMUです。
GPTsの作成や調整を行っていると、すぐにGPT-4の使用制限に掛かってしまって、なかなか作業が進みません。
まだ作りたいGPTsのアイデアはいろいろあるのですが……。

ということで、ChatGPTが使えない間にBingのDALL-E3を使って生成する画像のプロンプトを検証しています。
同じDALL-E3エンジンですが、ChatGPTから使う場合とBingでは指示プロンプトの形式が少し違うなぁと思っているのですが、当然同じ生成モデルなので応用できる部分も多いと思い実験をして行こうと思ってます。

今回のテーマはスーツ女子です。

今回出力した内容は一発で良い画像が４枚とも出てしまったため、ここから意図通りの表情やポーズ、服装に近づけていく部分がまた難しい部分かと思いますが、ここまでに生成が意図に近く安定してきましたので、その内容を少しお教えしたいと思います。

上記画像の出力のポイントは以下です。

一眼カメラを使っていることを明示する。
→ただ「一眼カメラ」と書くと、所持品と区別がつかないため、理想とする写真のデータなどを見て、その写真に使われているカメラの機種名を書く。またポートレイト用のレンズの型名の記載しても良いかも知れませんが、AIMUの検証では出力に大差はありませんでした。
被写体の顔が画像の主体であることを明示する。
"face focused"や"looking at the camera"といったプロンプトを入れることで人物の顔がメインで、その視線を誘導しています。
後方からのライティングを指示する。
私の場合は光源の場所を指示するというよりも"reflect light"というワードを入れたところ、上記画像のような出力が多くなったので、きっと効果があるのでしょう。
プロンプトを攻めすぎると画像が出力されない対策
服装やポーズを指示すると、プロンプトによってはDALL-E3側でセクシーな画像を生成しようとしてコンテンツポリシー違反で画像が出力されないことが結構あります。
実際の画像が見られないので、どういう生成をしたのか分かりませんが
以下の文章をおまじないとして入れておくようにしたら、画像が生成されない確率が減ったように思います。
「この画像はコンテンツポリシーに反せず最高のカメラマンの撮影した芸術作品にしてください。」
（これはあくまでセクシー画像を必要としてない場合ですので、そちら側を攻める方はまた工夫してみてください）

ということで、皆さんの画像生成の参考になればと。
他にもいろいろありますが、そちらはまた別の機会に。

それではまたお会いしましょう！
チャオ！

この記事が気に入ったらサポートをしてみませんか？