見出し画像

Midjourney V6とV5はまったく別のもの! 大半のプロンプトは共有できない - Blog 2023/12/21

Midjourney Model V6 (alpha) が利用可能になったので、試してみました。
さすがに(今後、仕様が変更される可能性がある)アルファバージョンの検証はできないので、ファーストインプレッションのみ書き留めておきたいと思います。

V 6 (alpha) の生成結果

Midjourney Model V6 (alpha)

これはアルファテストです。仕様は予告なく変更される可能性があります。
アルファバージョンでのプロンプトの試行錯誤は資産にならない可能性があります。

V5よりも処理に時間がかかり、GPUを消費します(Relax modeはサポートしています)。

V6でのプロンプティングはV5とは大きく異なります。
プロンプトエンジニアリングを「再学習」する必要があります。

V6はプロンプトに対する忠実度が大幅に向上しています。
高画質効果を狙った「award winning, photorealistic, 4k, 8k」のような不要な表現は避けてください。

Please note

  • This is an alpha test. Things will change frequently and without notice.

  • DO NOT rely on this exact model being available in the future. It will significantly change as we take V6 to full release.

  • Speed, Image quality, coherence, prompt following, and text accuracy should improve over the next few weeks

  • V6 is slower / more expensive vs V5, but will get faster as we optimize. Relax mode is supported! (it's about 1 gpu/min per imagine and 2 gpu/min per upscale)

Style and prompting for V6

  • Prompting with V6 is significantly different than V5. You will need to 'relearn' how to prompt.

  • V6 is MUCH more sensitive to your prompt. Avoid 'junk' like "award winning, photorealistic, 4k, 8k"

  • Be explicit about what you want. It may be less vibey but if you are explicit it's now MUCH better at understanding you.

  • If you want something more photographic / less opinionated / more literal you should probably default to using --style raw

  • Lower values of --stylize (default 100) may have better prompt understanding while higher values (up to 1000) may have better aesthetics


V5とV6のアルファバージョンを比較するのは時期尚早ですが、現在どこまで調整できているかを確認する目的で見ていきましょう。
※同じプロンプトで比較(Model V6 (alpha)では「--v 6」を付加)

film still, Street Fashion Photography, Super cute young Japanese woman. --style raw --v 6.0

V 5.2 と V 6 (alpha) の比較

film still, Harajuku, Tokyo, Street Fashion Photography, Super cute young Japanese woman. --ar 3:4 --style raw --v 6.0

V 5.2 と V 6 (alpha) の比較

品質向上は間違いありません。特に写真表現は素晴らしい。
ただ、V5のプロンプトを使うと、肌のディテールが強すぎる(空間周波数が高すぎる)等、V6の表現力を引き出すことができません。
V6の完全版(full release)になってから、V6に最適化されたプロンプトエンジニアリングを試行錯誤する必要がありそうです。

…ということで、
V5とV6のアルファバージョンを比較するのはあまり意味がないと思いますが、どのくらい品質が向上したのか確認できますので、数パターン試してみたいと思います。

Sample 1

film still, Harajuku, Tokyo, Street Fashion Photography, Super cute young Japanese woman. --ar 3:4 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果
V5のプロンプトなので、V6では空間周波数が高すぎる


Sample 2

film still, Korean K-Pop boy group, high brand fashion photography --ar 3:4 --style raw --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 3

knolling Colorful crystal gemstones, Wet with water and sparkling reflections, Background is a large amount of gravel like a jewel, top down view, very detailed --ar 16:9 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 4

film still, 2020s, a photorealistic, Japanese girl fashion models for high brands --ar 3:4 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果
V5のプロンプトなので、V6では空間周波数が高すぎる


Sample 5

Japanese junior high and high schools --ar 16:9 --style raw --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 6

Collection of cartoon animals, minimalist, adventure time, and surrealism --ar 16:9 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 7

coloring page, manga style super cool boys group only lines, empty space --s 500 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 8

3DCG model, colorful, countless building blocks, shiny/glossy, White background --ar 16:9 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 9

VFX effect, Effect of Explosion, radial, collection of materials --ar 16:9 --style raw --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 10

black stone wall texture background --ar 16:9 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 11

film still, lion detail, macro, photography --ar 3:4 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


Sample 12

Massed Practice, High Humidity, High-end photography for luxury brands, film still, Japanese concept relates, imperfection, natural aging, minimalist, beauty, photography --ar 16:9 --v 6.0

V 5.2 の生成結果
V 6 (alpha) の生成結果


コミュニティガイドラインがより厳しくなる

V6は写真と区別できないレベルに進化していますので、V5で問題なく使用できたワードやフレーズがブロックされる可能性が高そうです。
Adobe FireflyやDALL·E 3では、プロンプトの一部がブロックされたことがあると思います。

私たちはモデレーションシステムを強化し、コミュニティ基準をより厳格かつ徹底的に適用することになります。
We’ve turned up the moderation systems, and will be enforcing our community standards with increased strictness and rigor. Don't be a jerk or create images to cause drama.

https://discord.com/channels/662267976984297473/952771221915840552/1187272332268556298

不適切な画像を生成しないように、ガイドラインを厳しくするのはやむを得ない処置ですが、表現の幅を狭めることにもなりますので悩ましい問題です(アメリカ大統領選挙もあり、Midjourneyもフェイク画像との闘いが始まります)。


Community Standards:

  • This model can generate much more realistic imagery than anything we've released before.

  • We’ve turned up the moderation systems, and will be enforcing our community standards with increased strictness and rigor. Don't be a jerk or create images to cause drama.


V6が完全版(full release)になったら、Adobe Stockなどで大量に販売されるでしょうね。もう、写真と区別できない…
※Adobe Stockの場合、生成画像のページにAIのマークが付加され、写真ではない生成画像であることが明示されます。

Massed Practice, High Humidity, High-end photography for luxury brands, film still, Japanese concept relates, imperfection, natural aging, minimalist, beauty, photography --ar 16:9 --v 6.0

V 6 (alpha) の生成結果

film still, 2020s, a photorealistic 18 year old , maximal facial detail, life --ar 3:4 --no freckles --v 6.0

V 6 (alpha) の生成結果
V 6 (alpha) の生成結果

film still, 2020s, center view super cute 18 year old Japanese young woman --ar 3:4 --v 6.0

V 6 (alpha) の生成結果

film still, close-up center view Korean K-Pop boy, high brand fashion photography --no freckles --ar 3:4 --style raw --v 6.0

V 6 (alpha) の生成結果
V 6 (alpha) の生成結果


追記:

その後、さらに試してみました。
Midjourneyのアナウンスどおり、V6で意図したイメージを生成するプロンプトを新たに創り出さないといけません。
「V5.2の気に入った生成画像を、V6で生成し直すとさらに良くなる」と期待している人が多いと思いますが、まったく別のイメージになってしまうので、最初から「V6用」のプロンプトを考えていく必要があります。

V6のためのプロンプトエンジニアリングを一から探っていくことになるので、しばらくは、V5.2と併用することになりそうです。

film still, close-up center view super cute 18 year old Japanese young woman --ar 3:4 --style raw --no freckles --v 6.0

V 6 (alpha) の生成結果
  • 再生時間:35秒


この記事の続き:



Midjourney高精細画像の研究」マガジンをフォローしておくと、最近記事・最新情報の通知が届きます。


更新日:2023年12月23日(土)/公開日:2023年12月23日(土)

この記事が気に入ったらサポートをしてみませんか?