見出し画像

【Midjourney】プロンプトの基礎を知りたい!

こんにちは。アメリカ・シリコンバレー在住のSeikaです😊

Midjourneyで画像を作る際に大事なのが、プロンプト
では、「いいプロンプト」とは何でしょうか。
今回は、Midjourneyの推奨するアプローチを踏まえて、このテーマについて掘り下げていきます。

(2023年10月30日公開)



1. プロンプトの基本

Midjourneyを効果的に機能させるには、
端的な文が推奨されています。

❌悪いプロンプト
Show me a picture of lots of blooming California poppies, make them bright, vibrant orange, and draw them in an illustrated style with colored pencils
(カリフォルニアポピーがたくさん咲いている写真を見せて、鮮やかなオレンジ色で、色鉛筆でイラスト風に描いてください)

⭕良いプロンプト
Bright orange California poppies drawn with colored pencils
(色鉛筆で描かれた鮮やかなオレンジ色のカリフォルニア・ポピー)


2. 高度なプロンプト

より高度なプロンプトにするには、
1つ以上の画像URL、複数のテキストフレーズ、1つ以上のパラメータを含めることができます。

https://docs.midjourney.com/docs/prompts
  • 画像プロンプト(Image Prompt)
    写真をアップデートしそのURLを追加することで、生成される画像のスタイルや内容に影響を与えることができます。

画像をアップロード
画像をドラッグするとURLがプロンプトに反映されます
  • テキストプロンプト(Text Prompt)
    生成したい画像のテキスト説明です。
    例:Corgi, painting, underwater, neon, energetic, closeup 

  • パラメータ(Parameters)
    画像の生成方法を変更するためのものです。
    アスペクト比やモデル、アップスケールなどを変更することができます。
    例:--aspect, --ar, --chaos, --fast, --iw, --no, --quality, --q, --relax, --repeat, --r, --seed, --stop, --style, --stylize, --s, --tile, --turbo, --weird, --w, --niji, --version, --v

画像URL、テキストフレーズ、パラメータを含んだプロンプト👇https://cdn.discordapp.com/attachments/1042530196454125578/1168666434344333372/2023-07-20_23-04-21_000_2023-08-26T21_26_50.480.png?ex=6552986e&is=6540236e&hm=cfe552d014435cf608aa220cd4b673f8e301ec2cf203b04557513c5eeafcfbe7& Corgi, painting, underwater, neon, energetic, closeup --ar 3:2

3. プロンプトの長さ

Midjourneyでは一単語(または絵文字)でも画像の生成が可能です。
短いプロンプトはMidjourneyのデフォルトのスタイルに大きく依存します。より独創的な画像を生成するためには、詳細な説明を加えたプロンプトを使用しましょう。
しかし、長いプロンプトが必ずしも良いとは限りません。
自分のが作りたいコンセプト集中することが大切です。


一単語のプロンプトと説明を加えたプロンプトで比較してみます。

 teacher

「teacher」の一単語でも画像はできます。

Japanese female teacher in suit, Hasselblad X2D 100C, bokeh --ar 3:2 --v 5.2

狙いを定めたプロンプトでより自分の求めている画像が生成されます。

4. 文法・言葉選び

Midjourneyは文法や文章の構造、単語の意味を人間のように理解することはできません。
しかし、言葉選び方は大切です。
例えば「big」より「gigantic」、「enormous」、「immense」といったより具体的な表現を使うと良いでしょう。

単語の比較

4-1. big cat

big cat --ar 3:2 --niji 5

一般的な会話や文章で幅広く使われる「big」。

「big cat」というフレーズは、ライオンや虎などの大型のネコ科の動物を指す一般的な英語の表現です。
そのため、大きい猫は虎になりました。

4-2. gigantic cat

gigantic cat --ar 3:2 --niji 5

「巨大な」「莫大な」という意味の「gigantic」ではどうでしょう。

「big」よりもはるかに大きいことを強調する際に使われる単語だけあって、
巨大な猫が召喚されました。

4-3. enormous cat

enormous cat --ar 3:2 --niji 5

「enormous」「莫大な」「巨大な」という意味を持つ形容詞で、「gigantic」と似たニュアンスを持っています。
しかし、「enormous」は物理的な大きさだけでなく、抽象的な規模や影響、重要性を示す際にも使用されることがあります。


「gigantic」な猫と比べ、通常の猫の身体の比率がデフォルメされた印象を受けました。

4-4. immense cat

immense cat --ar 3:2 --niji 5

「immense」は「計り知れないほど大きい」「非常に大きい」という意味を持つ形容詞です。
「immense」は主に物理的な大きさに限らず、感情や価値、影響の大きさを強調する際にも使われます。

どれも普通の猫のサイズをはるかに超える巨大な猫ですが、
光を放ったり、人間が隠れていたりと今までの猫より独自性備えた猫になりました。

プロンプトのヒント

  • 単語の数を極力減らすことで、各単語の持つ影響が強まる。

  • Midjourney Botはコンマや括弧、ハイフンを解釈するわけではない。

  • Midjourney Botは大文字と小文字の区別を考慮しない。

  • Midjourneyのモデルバージョン4は、従来のモデルより文章構造の解釈が多少優れている。


5. 要素を意識する

Midjourneyでは、以下の要素を意識することが大切です。

/imagine <subject> <environment> <color> <mood> <composition>
/imagine <被写体> <環境> <色> <ムード> <構図>

5-1. 被写体(subject)
人物、動物、物体、場所などイメージの中心となる要素を入力します。

5-2. 環境(environment)
被写体がどのような背景や環境の中にいるかをキーワードで説明します。
例:「屋内(indoor)」「屋外(outdoor)」「月面(moon surface)」「ナルニア国(Narnia)」「水中(underwater)」

5-3. 色(color)
色の鮮やかさやトーンを指定します。
例:「カラフル(colorful)」「白黒(black and white)」「単色(monochrome)」「鮮やか(vivid)」「ミュート(muted)」「明るい(bright)」

5-4. ムード(mood)
画像の雰囲気やトーンを指します。
例:「穏やか(calm)」「騒々しい(noisy)」「エネルギッシュ(energetic)」

5-5. 構図(composition)
これは希望するショットの種類や角度を指定すします。
例:「ポートレート(portrait)」「ヘッドショット(Headshot)」「クローズアップ(Closeup)」「上空からの眺め(Birds-eye view)」

6. 数字・集合名詞の使用

複数形の単語は結果を予測しにくくなります。
具体的な数字や集合名詞を使いましょう。
※集合名詞→同じ種類の人や物が集まって1つの集合体を形成する名詞のこと。

Flock of sheep, Rolling hillsides Soft gray Tranquil Distant perspective --ar 3:2 --niji 5

❌悪い例 → ⭕良い例

  1. cats → three cats

  2. birds → flock of birds(鳥の群れ)

  3. Sheep → flock of sheep (羊の群れ)

  4. Fish → school of fish (魚の群れ)

  5. Cattle → herd of cattle (牛の群れ)

  6. Lions → pride of lions (ライオンの群れ)

  7. Bees → swarm of bees (蜜蜂の大群)

  8. Whales → pod of whales (クジラの群れ)

  9. Wolves → pack of wolves (狼の群れ)

  10. Elephants → herd of elephants (象の群れ)

  11. Stars → constellation of stars (星座)

  12. Grapes → bunch of grapes (ぶどうの房)

  13. family → a family of five (5人家族)

  14. audience → an audience of spectators (観客の集まり)

  15. board → a board of directors (取締役会)

  16. cabinet → a cabinet of ministers (大臣の内閣)

  17. class → a class of students (学生のクラス)

  18. club → a club of members (メンバーのクラブ)

  19. committee → a committee of experts (専門家の委員会)

  20. company → a company of employees (従業員の会社)

  21. crew → a crew of sailors (船員のクルー)

  22. crowd → a crowd of people (人々の群衆)

  23. enemy → an enemy of the state (国の敵)

  24. firm → a firm of lawyers (弁護士の事務所)

  25. generation → a generation of young people (若者の世代)

  26. government → a government of officials (役人の政府)

  27. jury → a jury of peers (同僚の陪審員)

  28. ministry → a ministry of bureaucrats (官僚の省)

  29. orchestra → an orchestra of musicians (音楽家のオーケストラ)

  30. party → a party of politicians (政治家の政党)

  31. public → the general public (一般大衆)

  32. staff → a staff of workers (労働者のスタッフ)

  33. team → a team of players (選手のチーム)

  34. union → a union of workers (労働者の組合)


7. まとめ

Midjourneyを使って高品質な画像を生成するためには、プロンプトの作り方が鍵です。
具体的な数字や集合名詞の使用、適切な文法や言葉の選び方、さらにはプロンプトの要素を意識することで、希望する画像を生成することができます。

是非、今回の内容を意識しながらMidjourneyでの画像を楽しんでくださいね。

それでは今回はここまでです。
次回の記事でお会いしましょう~!

Follow me here😊
Midjourneyのギャラリーはこちらから。

YoutubeInstagramXThreadsDribbbleLinkedinBehanceNotionPortfolioFigma質問箱



この記事が参加している募集

AIとやってみた

よろしければサポートお願いいたします。いただいたサポートはクリエイターとしての活動費に使わせていただきます。