どの無料のテキスト生成AIで作ればMidjourneyで簡単に高精度な画像が作れるか？（プロンプト掲載）

浅川浩二

2024年3月26日 13:32

ChatGPTなどでAIに画像を作らせる

MidjourneyもV6の登場で、通常の人物生成であれば実写と区別ができないほどの画像を生成出来るようになったことで、それらを制御する生成用テキスト（プロンプト）の質が重要になってきました。

普段は自分で作文して、英訳したものを使いますが、今回は無料で使える4つのLLM（AIチャット）に指示してどんな画像が生まれるのか検証してみます。

元の書き出し指示内容

各LLMには同一の日本語の指示を書いてその内容で書き出ししたものを登録することとする。以下がLLMに指示した内容。日本語で書き出された場合は英語に自動翻訳して各画像生成AIに指示する。

あなたはMidjourneyのプロンプトを作る職人です。下記の内容のプロンプトを生成してください。日本人女性のスナップ写真で写真的質感の高いもの。年齢は20歳で、日本人女優。屋外での映画宣伝用写真。

1.ChatGPT 3.5

まずはメジャーどころでChatGPTですが、無料バージョンだと基本的に2021年までしか学習していないので、その質は不安ですがやってみましょう。

以下は、あなたが要求したプロンプトに基づいて生成したものです。
「20歳の日本人女性が、日本の屋外で撮影されたスナップ写真。彼女は日本人女優で、写真的質感の高さが際立つ映画宣伝用の写真です。彼女の表情やポーズからは、若さと活気が感じられます。背景には日本の風景が広がり、写真全体からは日本独特の雰囲気が漂っています。」

日本語なので、英語に翻訳（Google Trancerate）したプロンプトが以下の内容

使用したプロンプト

A snapshot of a 20-year-old Japanese woman taken outdoors in Japan. She is a Japanese actress, and this photo for a movie promotion highlights her high level of photographic quality. Her facial expressions and poses convey her youth and vigor. The Japanese landscape spreads out in the background, and the entire photo has a unique Japanese atmosphere. --v 6.0

さあ、作ってみましょう。

プロンプトの質自体は悪くないと思いますが、ちょっと日本という単語が多すぎるかもですね。その為もあってか衣装が着物になっています。

2.Gemini

GoogleのGeminiを使ってみた場合、詳細な条件などが加味された返答がされます。

---- 書き出し結果 ----

完璧なスナップ写真：20歳の女優、屋外での映画宣伝

構図:

自然な笑顔: 少し斜めを向き、カメラに自然な笑顔を向ける。
動きのある瞬間: 風になびく髪、歩いている姿、振り返る瞬間などを捉える。
光と影: 木漏れ日や街灯の光で、顔や体に陰影をつける。

被写体:

20歳の女優: 清楚で可愛らしいイメージの女優。
服装: 映画の雰囲気に合わせた衣装。カジュアル、フォーマル、制服など。
髪型: 風になびくロングヘア、ポニーテール、ハーフアップなど。

背景:

都会の風景: 高層ビル、公園、カフェなど。
自然の風景: 海、山、草原など。
映画の舞台: 映画の内容に合わせた背景。

カメラ設定:

レンズ: 50mm、85mmなどの単焦点レンズ。
絞り: f/2.8、f/4などの開放絞り。
シャッタースピード: 1/125秒、1/250秒など。

参考画像:

https://www.eropuru.com/zyoyu/index.html
このリンク先さっき確認したんだけどAV系の女優のリストやん！なに参考にしとるんじゃ！女優という単語に反応したんだと思うけど・・多分私達が沢山検索している結果かもね。
https://www.cinejp.com/%E6%98%A0%E7%94%BB%E5%AE%A3%E6%9D%90/
https://www.gettyimages.co.jp/%E5%86%99%E7%9C%9F/%E3%83%9D%E3%83%BC%E3%83%88%E3%83%AC%E3%83%BC%E3%83%88

Midjourney プロンプト例:
1. 清楚な笑顔の女優

(Actress name), 20歳, 清楚, 笑顔, 屋外, 映画宣伝写真, 自然光, 風になびく髪, ロングヘア, 白ワンピース, 公園, 50mmレンズ, f/2.8, 1/125秒

2. 都会を歩く女優

(Actress name), 20歳, クール, 街歩き, 映画宣伝写真, 夕暮れ, 街灯, ハイヒール, ロングコート, 高層ビル, 85mmレンズ, f/4, 1/250秒

3.映画の舞台に立つ女優

(Actress name), 20歳, 映画(映画名), 主人公, 凛々しい, 決意, 屋外, 戦場, 剣, ロングヘア, 鎧, 朝日, 50mmレンズ, f/2.8, 1/125秒

追加情報:

上記はあくまでも例です。
好みやイメージに合わせて、自由にカスタマイズしてください。
より具体的なイメージがある場合は、詳細な情報を追加してください。

その他:

Midjourney は英語のサービスです。日本語でプロンプトを作成する場合は、英語に翻訳する必要があります。
Midjourney の使い方については、公式ドキュメントやチュートリアルを参照してください。

これらのプロンプトを使って、あなただけの完璧なスナップ写真を生成してください！

使用したプロンプト

上記内容に女優の名前を入れろとの指示だったのでたまたま Claude 3 出できた名前を入れていますが、実はこの女優の名前に関してはほぼ影響は少ないかもしれません。まずそれらを学習できていない可能性が高いですし、。個人名を入れたからと言って同じ顔の人物を生成すると肖像権などに抵触します。

ただ、日本人であるかどうかは、ある程度名前で判断している可能性もあって、メジャーな日本人的名前を入れることで、日本人の特徴を加味した人物になります。

きっちりキャラクタを決めたい場合はその対象となる写真を指定して --cref コマンドを使うべきですが、その場合は肖像権に留意して作るべきですね。

Hana Sugisaki, 20 years old, neat, smiling, outdoors, movie promotional photo, natural light, hair waving in the wind, long hair, white dress, park, 50mm lens, f/2.8, 1/125 seconds

先に指示された他の条件的な単語を組み合わせることで更に完成度を高める事ができそうですが、問いかけの文書自体を工夫することでもっと詳細なプロンプトを吐き出してくれるでしょう。

3.Claude 3

最近使いだしたLLMですが、非常に論理的な応えを返してくれます。上記同様の問いかけをした結果です。

---- 書き出し結果 ----

了解しました。高画質な日本人女優のアウトドア映画プロモーション写真のプロンプトを作成します。

A highly detailed and photorealistic snapshot photograph of a beautiful 20-year-old Japanese actress, Hana Sugisaki, with porcelain skin, large expressive eyes and long flowing black hair, posing outdoors in front of a serene Japanese garden with a koi pond and blooming cherry blossom trees, wearing an elegant light blue chiffon dress with floral embroidery details, looking dreamy and serene yet with a hint of confidence and mystery in her expression, as if promoting her latest romantic drama film set in traditional Japan, cinematic natural lighting --v 5 --ar 3:2 --uplight --upbeta

このプロンプトには以下の要素が含まれています:

高画質な「highly detailed and photorealistic snapshot photograph」
20歳の美しい日本人女優「a beautiful 20-year-old Japanese actress, Hana Sugisaki」
華やかな外見「porcelain skin, large expressive eyes and long flowing black hair」
日本庭園の前でのポージング「posing outdoors in front of a serene Japanese garden with a koi pond and blooming cherry blossom trees」
優雅な青い花柄ドレス「wearing an elegant light blue chiffon dress with floral embroidery details」
夢心地で自信とミステリアスな表情「looking dreamy and serene yet with a hint of confidence and mystery」
伝統的な日本を舞台にした恋愛ドラマ映画の宣伝写真イメージ「as if promoting her latest romantic drama film set in traditional Japan」
絵画のような自然な光「cinematic natural lighting」
画質最高レベル5、アスペクト比3:2、ライティング調整、最新ベータモデル使用

このようにディテールを詰め込むことで、撮影用の高品質な宣伝写真のような画像が生成される可能性が高まります。

使用したプロンプト

A highly detailed and photorealistic snapshot photograph of a beautiful 20-year-old Japanese actress, Hana Sugisaki, with porcelain skin, large expressive eyes and long flowing black hair, posing outdoors in front of a serene Japanese garden with a koi pond and blooming cherry blossom trees, wearing an elegant light blue chiffon dress with floral embroidery details, looking dreamy and serene yet with a hint of confidence and mystery in her expression, as if promoting her latest romantic drama film set in traditional Japan, cinematic natural lighting --v 6 --ar 3:2

縦横の比率を表す --ar 3:2 などが追加されていますが、使えないオプションなどもあるので削除しました。それにしても細かい部分まで指定されているのでこれを元にエディットすれば更によいプロンプトになりそうです。

4.Copilot

最後にMicrosoftのChatGPT4であるCopilotに聞いてみましょう

---- 書き出し結果 ----

ああああああ、プロンプトではなく画像作っちゃいました！！！

いやこれはこれでよくできているけどそうだじゃない！！うーん条件を変えても写真作っちゃうな。

ということで今回Copilotでプロンプトを書き出すことできなかったのですが、多分命令文を工夫すれば可能になるでしょう・・しらんけど。

5.まとめ

1位 Claude3

初心者が簡単に高精度なプロンプトを書き出すのに最もすぐれていると感じました。2位のGeminiはカスタマイズするためのヒントが豊富ですが、初心者にはClaude3を使ったほうが良い結果になる可能性が大きいです。

ただし、まだ一般的ではないため、ログイン登録などでつまずく可能性もありますが、単純な文書作成にも優れていますので有料化される前にぜひ利用してみて下さい。

2位 Gemini

今回の問いかけでは、書き出されたサンプルプロンプトが Midjourney の古いバージョンに対応している短いセンテンスになっていますが、問いの書き方次第で高度なプロンプトも作成できます。

さらに、参考になる追加のテキストなども提示されるため、中級者以上が使用するのに適していると思われます。

3位 ChatGPT 3.5

先述の2つに比べるとやや能力の問題を感じます。今後も私が使うことはないと思います。基本的にに学習データが古いために新しいことを覚えることができないからです。

圏外 Copilot

プロンプトを書いてと指示しても、DALL-E 3で画像が作成されてしまうため、利用できませでした。これは仕方がありません。無料でDALL-E 3が使えるという部分においては十分に利用価値もありますが、現在のレベルだと本当にリアルな人物をつくるのは難しいかも。

ちょっと先に提示した Claude 3のプロンプトで作らせてみましょう。

あらーーー作ってくれません。あ。もしかすると個人名が入ってるからかも・・それを消してやってみましょう。

A highly detailed and photorealistic snapshot photograph of a beautiful 20-year-old Japanese actress with porcelain skin, large expressive eyes and long flowing black hair, posing outdoors in front of a serene Japanese garden with a koi pond and blooming cherry blossom trees, wearing an elegant light blue chiffon dress with floral embroidery details, looking dreamy and serene yet with a hint of confidence and mystery in her expression, as if promoting her latest romantic drama film set in traditional Japan, cinematic natural lighting

ということで、Claude3のプロンプトとは相性悪いみたいです。

この記事が気に入ったらサポートをしてみませんか？