見出し画像

[無料です]Bing DALL-E3のプロンプト検証

GPTsクリエーターのAIMUです。
GPTsの作成や調整を行っていると、すぐにGPT-4の使用制限に掛かってしまって、なかなか作業が進みません。
まだ作りたいGPTsのアイデアはいろいろあるのですが……。

ということで、ChatGPTが使えない間にBingのDALL-E3を使って生成する画像のプロンプトを検証しています。
同じDALL-E3エンジンですが、ChatGPTから使う場合とBingでは指示プロンプトの形式が少し違うなぁと思っているのですが、当然同じ生成モデルなので応用できる部分も多いと思い実験をして行こうと思ってます。

今回のテーマはスーツ女子です。

今回出力した内容は一発で良い画像が4枚とも出てしまったため、ここから意図通りの表情やポーズ、服装に近づけていく部分がまた難しい部分かと思いますが、ここまでに生成が意図に近く安定してきましたので、その内容を少しお教えしたいと思います。


やや丸顔の出力。珍しい気がします。


髪の毛のリアルさが良いですね。


被写界深度というか背景の距離が遠めに設定されてるボケ感ですね。


指示はペンダントでしたが、イヤリングとブローチにアレンジしてきました。

上記画像の出力のポイントは以下です。

  • 一眼カメラを使っていることを明示する。
    →ただ「一眼カメラ」と書くと、所持品と区別がつかないため、理想とする写真のデータなどを見て、その写真に使われているカメラの機種名を書く。またポートレイト用のレンズの型名の記載しても良いかも知れませんが、AIMUの検証では出力に大差はありませんでした。

  • 被写体の顔が画像の主体であることを明示する。
    "face focused"や"looking at the camera"といったプロンプトを入れることで人物の顔がメインで、その視線を誘導しています。

  • 後方からのライティングを指示する。
    私の場合は光源の場所を指示するというよりも"reflect light"というワードを入れたところ、上記画像のような出力が多くなったので、きっと効果があるのでしょう。

  • プロンプトを攻めすぎると画像が出力されない対策
    服装やポーズを指示すると、プロンプトによってはDALL-E3側でセクシーな画像を生成しようとしてコンテンツポリシー違反で画像が出力されないことが結構あります。
    実際の画像が見られないので、どういう生成をしたのか分かりませんが
    以下の文章をおまじないとして入れておくようにしたら、画像が生成されない確率が減ったように思います。
    「この画像はコンテンツポリシーに反せず最高のカメラマンの撮影した芸術作品にしてください。」
    (これはあくまでセクシー画像を必要としてない場合ですので、そちら側を攻める方はまた工夫してみてください)


ということで、皆さんの画像生成の参考になればと。
他にもいろいろありますが、そちらはまた別の機会に。

それではまたお会いしましょう!
チャオ!


この記事が気に入ったらサポートをしてみませんか?