見出し画像

DALL・Eの画像認識能力

また自作GPTsのアイデアが浮かんでしまったので、結局本日も色々試して沼ってしまう結果に…。

テキスト部分は想定通りに動かせるのですが、画像部分ではDALLEの画像認識能力の問題?で上手く動作させる事ができませんでした。

画像が単体の場合は、今回のタイトル画像の様にそれなりにいい感じのイラストになるのですが、複数枚の画像をまとめる生成の場合や、指定の場所への画像の配置等になるとほとんど対応できなくなります。

本来であればCHATGPT単体で済ませたいところなのですが、画像に関しては他のアプリの力も頼った方がベターですね。

アップロードしたPDFを読み込ませて要約するGPTs等があるので、外部の画像を読み込ませて認識させようとしましたが上手くいきませんでした。単純に自分の技量不足かもしれませんが。

子供食堂ボランティアに登録してるので、食堂の食材、運営費用等に使用させて頂きます。よろしくお願い致します。