見出し画像

MidjourneyV6のプロンプト作成で知っておくべき4W1Hテクニックとは?

2023年12月22日、Midjourney V6がクリスマス前にリリースされたあのとき初めて画像を生成したときの興奮は今でも忘れません。まるで本物の写真が出てきたかのような衝撃…

最新のMidjourney v6ではプロンプトを理解するための方法が改善されており、ランダムなフレーズや単語を使用する必要がなくなりました。これが意味するのは、プロンプトを作成するための新しいアプローチが必要だということです。

そこで今回は初心者から上級者までMidjourneyv6に関して知っておくべき4W1Hテクニックに関して書きたいと思います。

Midjourneyv6の変更点

FounderのDavid Holzも言っていた通り、V6 モデルは以前の5.2モデルよりもプロンプトをはるかに理解できるため、「8k、high quality」などをプロンプトに入れる必要がなくなりました。まず理解しておくべきは以下の点です。

  • より正確なプロンプトが表示され、長いプロンプトに正確に従うことができるようになった

  • 画像の一貫性の向上

  • 画像プロンプトとリミックスの改善

  • 引用符で囲むことでtext を含めることができます: "example"

  • アップスケーリングの改善

以前だとこんなプロンプトが流行っていましたよね。こういうマニアックなカメラ用語「fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM」とか入れていませんでした?

筆者がMidjourneyで生成

21 year old japanese girl, in school, beauty, long black hair, sun light, insane detail, smooth light, real photography fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM --ar 16:9 --s 750 --v 6.0

でも今はこれくらいのプロンプトでも十分美しい画像を生成することができるのです。美しい…

筆者がMidjourneyで生成

real photography of 21 year old japanese girl in sunlight --ar 16:9 --s 750 --v 6.0 --style raw

v6特性を活かす4W1Hテクニック

さてここでシンプルなプロンプトとは何なのかということをもう一度考えるてみましょう。私がたどり着いた最もシンプルなパターンはこれです。

何を、誰が、いつ、どこで、どのようにして」に分解する。

これが一番シンプルで様々なものに応用がきき、覚えやすいプロンプトです。このテクニックを使ってどのような画像が作成されるのか見てみましょう。

4W1H 技法でプロンプトを書くとは?以下のことを指します。

何を ‐ 画像のタイプ、アート スタイル、カテゴリ
誰が - 主な主題、テーマ
どこで
‐ シーン、設定
いつ - 時間、照明
どのように- スタイル、レンダリング、詳細

"何を(What)"は画像の種類のこと

一貫したスタイルを確保するために、最初に画像全体のタイプを指定します。これには、次のような特定の美的または芸術的な方向性を提供することを意味します。

  • 写真の種類 ‐ Portrait,Candid, Wide angle,Black and White, Landscape, Full Body etc

  • アート媒体 ‐ Pencil, Pastel, Watercolor, Oil painting,Charcoal etc

  • アートスタイル ‐ Baroque, Impressionist, Renaissance, Abstract, Surrealism etc

  • 素材の質感 ‐ Metal, Fabric, Wood, Marble, Glass, etc

  • カテゴリー - UI Design, Interior Design, Logo Design,Photographic Image etc

"誰が(Who)" は 主な主題やテーマのこと

画像の主な焦点は、人や動物、キャラクター、物体などです。さらに、副題も追加できます。

主題 ‐ Beautiful girl(美しい女の子)
副題 ‐ Black hair(黒色の髪), wedding dress(ウエディングドレス), gorgeous clothes(豪華な服装)

"どこで(Where) "は シーン、設定のこと

設定や背景を説明します。判断できない場合は、「壮大なシーン」などの一般的な用語も使用できます。

屋内や屋外、海の景色、宇宙空間、そして京都でもできます。

"いつ(When)" は 時間(ライティング)のこと

指定するのは、時間や季節、年や歴史の区切りです。

  • 時間: 2000s、Spring, Christmas etc

  • 照明:Morning, golden hour, blue hour, sunset, midnight, natural light, studio light etc

"どのように(How)" は スタイル、レンダリング、追加の詳細のこと

これは画像の文体的な性質をカバーします。重要な要素:

  • アート スタイル - Artists, Studios, Arts Movement etc

  • 3D スタイル - 3D, VFX, Game Engines

  • 色: Vibrant(鮮やか), calm(落ち着いた), bright(明るい), monochromatic(単色), colorful(カラフル), black and white(白黒), pastel(パステル) etc.

  • 照明: Soft, ambient, cloudy, cinematic, studio light, etc.

  • 気分:Happiness, calm, energy, etc.

画像の種類について考える時は、関連する用語に注目しましょう。初心者の場合は、難しい言葉ではなく、簡単なことから始めることがおすすめです。

実際に画像生成してみよう!

1.ポートレイト

筆者がMidjourneyで生成

Portrait of a beautiful woman with long blonde hair and white wedding dress standing in front of a church, blue hour, soft colors --ar 16:9 --style raw --v 6.0

4W1Hに分けてみてみるとこうなります。

  1. 何を‐ Portrait

  2. 誰が ‐ a beautiful woman with long blonde hair and white wedding dress

  3. どこに ‐ standing in front of a church

  4. いつ ‐ blue hour

  5. どのように ‐ soft colors

2.ストリート写真

このブログのメイン画像で使ったプロンプトは以下の通りです。これはChatGPTのGPTsにこの4W1Hを覚え込ませて生成しました。v6は引用符で囲むことでテキストを画像の中に含めることができます。ちょっと小さくてわからないかもしれませんが左下に"Do you know this?"って単語が含まれているのがわかりますか?

筆者がMidjourneyで生成

Street photography theme, a young Japanese woman in her 20s asking " Do you know this?" while looking curiously at the camera, close-up angle, sharp focus on her face, soft evening lighting, clear weather with a dusk ambiance, shot with a digital SLR camera, high realism

これも同じく4W1Hに分けてみてみるとこうなります。

何を‐ Street photography

誰が ‐ a young Japanese woman in her 20s

どこに ‐ 指定なし

いつ ‐ soft evening lighting(夕方の柔らかい照明), clear weather with a dusk ambiance(夕暮れの晴天)

どのように ‐ digital SLR camera, high realism(デジタル一眼レフカメラで撮影、高いリアリズム)

商業用デザインをV6で作る

UIデザイン(HPやLP)

筆者がMidjourneyで生成

UI design of botanical plants shop, landing page, minimal, classy, beige and navy green --ar 4:3 --v 6.0

パッケージデザイン

Package design of botanical plants shop, minimal, classy, beige and navy green --ar 4:3 --v 6.0

基本的には、すべてのプロンプトの最初の単語をカテゴリに変えるだけです。やばいくらい簡単でしょ?

[ Industry / Category ] design of [ subject/ product ], [ How ‐ description, style ]

まとめ

4W1Hテクニックを使いこなせるようになると、プロンプトの様々な要素(主題、素材、スタイル、時代)を容易に調整できるようになります。

この方法を理解し実践することで、簡単な操作から始め、徐々に経験を積み、より高度なスキルを身につけることができます。

画像を作成する回数が増えるにつれて、直感的なスタイルが確立され、プロンプトの使い方が上達します。

ただ、そんな事を言っている私はもっぱらこの4W1H手法をGPTsに叩き込みそちらで無限出力しています…w
そうしたほうが楽だし、便利なんです。それはまた次回の記事で。

この記事が気に入ったらサポートをしてみませんか?