AI映画製作の世界では、今週もまた興味深い進展がありました。Midjourneyは待望のキャラクター一貫性機能をリリースし、PikaとElevenLabsはそれぞれ独自の音響効果ツールを発表しました。また、OpenAIのCTOからは、Soraの市場投入時期に関する最新情報が提供されました。Midjourneyでは、同じキャラクターを同じ衣装で何度も簡単に作成できるようになり、物語や映画、広告プロジェクトにおいて大きな進歩となります。さらに、キャラクターの衣装変更やスタイル一貫性など、さまざまな機能を組み合わせて使用することで、AIを活用した映像制作の可能性が広がっています。PikaとElevenLabsは音響効果の自動追加機能を提供し、それぞれのツールの有効性を競っています。また、新しいポッドキャストエピソードや短編映画の公開、さらにはSoraのリリース予定やChatGPT-4.5 Turboのリリースの噂など、AI映像制作の分野は急速に発展しています。
公開日:2024年3月16日
※動画を再生してから読むのがオススメです。
AI映画製作の世界では非常に興味深い週でした。
Midjourneyはついに私たちが待ち望んでいた機能をリリースしました。
PikaとElevenLabsは効果音ツールを発表しましたが、どちらがより優れているのでしょうか?
そして、OpenAIのCTOはSoraが市場に登場する時期についてアップデートを提供してくれました。
これが今週のAI映画ニュースです。
まずは大きな話題から始めたいと思います。それはもちろん、Midjourney内の新しいキャラクターの一貫性機能です。
キャラクターの一貫性はこれまで非常に難しいものでしたが、この新機能を使えば同じ服を着た同じキャラクターを簡単に何度も作成できます。
これは物語作りや映画、広告プロジェクトにとって非常に重要です。
Midjourney内で一貫したキャラクターを作成する方法をお見せしたいと思います。
まずはデスクトップ版での使い方をお見せし、その後Discord版に移動します。
この機能は、Midjourney内で作成された画像との相性が良いと言えます。
画像をアップロードする場合、Midjourneyで直接作成されたキャラクターを使用するよりも、結果が良くないことがあります。
ここで始めてみましょう。
プロップを検索しに行きますが、とりあえず男性と言ってみましょう。非常に一般的なものを見つけて、ここで使用したい男性を見つけましょう。
このおかしな服を着た男性はどうでしょうか?
これは通常、繰り返しプロンプトするのが非常に難しいことですが、新機能では実際にかなり簡単です。
ここで画像ボタンをクリックします。画像を使用し、今度はプロンプトで画像を使用します。
ここには非常に小さなアイコンがありますが、見分けが難しいですが、基本的には現在画像リファレンスとして使用されています。
しかし、左端まで移動すると、人物アイコンがあります。それをクリックすると、基本的にはキャラクターリファレンスとして使用されています。
ニューヨーク市の男性の映画的な静止画と言って、Enterキーをクリックしてください。
こうして、この男性の写真をいくつか撮影しましたが、それは写実的に見えます。
彼はニューヨーク市にいて、あのクレイジーな服を着ています。
これはこれまでの時点では基本的に不可能だったでしょう。
彼の後ろ姿や横からの写真がありますが、ああ、何が起こっているのか全くわかりません。
彼はひどい事故に遭ったのかもしれませんね、なぜなら彼の頭が逆向きに見えます。
特にMidjourneyの中で利用可能な他の機能と組み合わせてこのツールを使用し始めると、本当に興味深いことができます。
異なる服のオプションを持つ一貫したキャラクターをどのように作成できるかをお見せしたいと思います。
本当に興味深いですね。
検索プロンプトに移動すれば、例えば「広角で女性」と言って、女性の広角写真を見つけて、彼女が着ているすべての服やその他のものを見ることができます。
たとえば、この女性、この茶色のジャケットと青いアンダーシャツを着ているのが見えますね。
もし画像を使用し、キャラクターリファレンスボタンに移動すると、女性がロサンゼルスのダウンタウンに立っていると言えます。
そして、エンターキーを押すと、はい、もちろん、この女性がロサンゼルスのダウンタウンにいることがわかります。
そして、彼女は基本的に各ショットで同じ服を着ています。
もし実際にこの女性に違う服を着せたいと思ったらどうでしょうか?
もしかしたら、探索をしてバーチャルなフォトシュートをしたいと思っているかもしれませんが、Midjourneyを使用すれば非常に簡単にできます。
この使用ボタンをクリックするだけで大丈夫です。
こちらに再度入力された参照画像があります。
そして私たちがすることは、文字重量を表す--CWというコードを入力することです。文字重量は0から100までのスライディングスケールで、0は文字が基本的に服装や髪型を変えることができ、キャラクターが着ているものにはより多くの変動があることを意味し、一方、100のキャラクター重量はデフォルトで、キャラクターは一般的に同じ服を何度も着ています。
これを文字重量0に変更します。
そして、SF映画の中の女性と言いましょう。
さて、これで行きましょう。
そして、私たちが得るものを見てみましょう。
では、ここで結果を見てみましょう。
この女性は、未来的なヘッドフォンと黄色のジャケットを着ています。
次の写真では、ここに着古したコートを着ており、イヤリングをしています。
次に彼女が着ているのは、レザージャケットだと思います。
そして、これもまったく異なるコートを持っています。
キャラクターの重みを使って、キャラクターの衣装を少し探求することができます。
そして、お気に入りの衣装を見つけたら、キャラクターの重みを100に変更して、シーン間で同じキャラクターを取得できるように促すことができます。
一貫したスタイルを持つキャラクターを一貫したスタイルでブレンドする能力もあります。これは、一貫した映画的な外観を持とうとしているときに非常に重要です。
こうやってやります。
ここにプロンプトに行くだけです。
女性と言って、ここで使いたい人を見つけます。
この女性を使いたいとします。
画像ボタンをクリックして、彼女をキャラクターリファレンスに設定します。
私たちもスタイルを見つけたいと思っています。
スタイルを見つけるために、ここで検索バーに行って、シネマティックな静止画を入力し、使用したい色調やスタイルを見つけましょう。
私はこのぼんやりとしたセピア色調が好きです。
この画像をクリックして、スタイルに移動します。
私たちはここでアイコンをクリックして一貫したキャラクターを持っています。
ニューヨーク市の女性のシネマティックな静止画をプロンプトすることができます。
そしてクールなことは、あなたのコードが実際にここでも機能することです。
スタイルの重みはデフォルトで100です。
もしそれを変更したい場合は、--swと入力して、この参照写真から最大のスタイルを継承したい場合は、すべてを1000まで上げることができます。
デフォルトが好きです。
それは完全に大丈夫だと思います。
そして、'--r' もできますし、このプロンプトを5回繰り返すには 'r5' と言うこともできます。
それらのコードはすべてウェブサイトでも機能します。それは本当に素晴らしいことです。
さあ、エンターキーをクリックしてください。
ここから始めます。
ここで私たちの写真を見てください。すべてが一般的に同じ色調です。
スタイルは非常に似ています。
キャラクターは一貫しており、本当に良く見えます。
おそらく、クールやインサイトベーススワップのようなツールを使用することで、さらに顔を安定させるのに役立ちます。
しかし、素早いキャラクターベースの場合、Midjourney内部のこの新しいキャラクター一貫性ツールは絶対に必要です。
そして、Midjourneyのアルファ版は、プラットフォームで1000枚以上の画像を生成した人すべてに公開されていることをお知らせしておきます。
まだアルファにアクセスできない場合は心配しないでください。
依然として同じ機能がすべて利用できます。
この機能をすべて解除するには、DiscordとDiscord内部のいくつかのコードを使用する必要があります。
あなたをほったらかしにはしません。
心配しないでください。
Discord内で一貫したキャラクターを取得する方法をお見せします。
私はDiscord内にいます。
私はDiscordボットをプライベートサーバーに招待し、このヒップスター風の男性の写真を持っていて、ここに彼を私たちのチャットチャンネルにドロップするつもりです。
基本的に、する必要があるのは右クリックしてリンクをコピーするだけです。
このキャラクターの画像リンクを持っているので、前進/想像をします。
西部劇の男性のシネマスチルと言います。
それを行うために、キャラクターの参照コードを追加する必要があります。
--C R E Fを入力し、スペースを入れてリンクを貼り付けるだけです。
キャラクターの重さについても、同じことができます。
ダッシュ -C W スペースを入れて、彼の服装が浮かび上がるように100と言います。
実際、これは非常に印象的であり、西部劇では通常、この種の服装を着た人々が登場しません。
どのようになるかを本当に興味津々で見守っています。
こちらの結果を見てみましょう。
この人がいて、うん、それらの写真はかなり一貫して見えます。
そして、カラーグレーディングがちょうど非常に典型的な1960年代のカラーグレードとフィルムストックスタイルを持っているのが好きです。
それは本当に素晴らしく見えます。
Pika Labsのチームは、彼らのツールの中で自動的に音響効果を映像に追加する機能も提供しています。
どうやって使うかをお見せしましょう。
この機能を使う方法はいくつかあります。
全てお見せします。
基本的には、Pika.artに行って、こちらの作成ウィンドウに移動して、プロンプトを貼り付けるだけです。
犬が公園で吠えると言って、その音響効果ボタンをクリックしてください。
そして、生成ボタンをクリックしてください。
私たちの結果を聞いてみましょう。
つまり、犬が吠えているような音がします。
少し違和感がありますが、それほど悪くはありません。
また、画像を使用して生成したビデオに効果音を追加する機能もあります。これは本当に役立ちます。
する必要があるのは、画像またはビデオボタンをクリックして画像を選択するだけです。
ここにこのカエルの写真があります。それをアップロードして、効果音ボタンが選択されていることを確認して、生成ボタンをクリックしてください。
私たちの結果を聞いてみましょう。
それは呪われたカエルのような音に聞こえるので、あまりうまくいっていないと思います。
以前に生成したビデオにも効果音を作成する機能があることも付け加えておきます。
一つ前のビデオのいずれかに行くだけでいいんです。
こちらが先週使った火事の家の例です。
編集をクリックするだけで、音効ボタンを押して、聞きたい音効を入力できます。
この場合、家が燃えている、大きな火事と言ってみましょう。
そうですね。
そして、生成をクリックします。
まあ、約30秒で3つのクリップが生成されました。
それでは、聞いてみましょう。
これが1番です。
ああ、すごい爆発だ。
その実、本当に良さそうです。
その1つは本当に素晴らしい仕事をしたと思います。
これが3番目です。
この場合、Pikaは実際に効果音をとてもうまくやったと思います。
今、基本的に1つを選んで続行をクリックし、基本的にスクラブして、効果音を配置したい正確な場所を選ぶことができます。
それを始めに添付して、ビデオに添付をクリックします。
そして、できあがりです。
ElevenLabsのチームも負けじと、自分たちのプロンプトを入力して効果音を取得するためのツールを開発しました。
現在は限定リリースのみですが、ベータ版にアクセスできるので、今日あなたと一緒にそれを紹介したいと思います。
ElevenLabsの中にいます。
基本的には、左上の効果音メニューに移動して、聞きたい効果音を入力するだけです。
ElevenLabsでは、以前のカエルの動画でそれをテストしたいと思います。
公園でカエルを見つけて、効果音を生成します。
約10秒後、5つの異なる生成物が生み出されました。
ここでいくつかを聞いてみましょう。
これが1番です。
カエルのような音です。
カエルのような音です。
それは素晴らしいです。
ご覧の通り、ElevenLabs内の効果音は、私たちの意見では、この時点で少し良く聞こえます。
お好きな効果音を教えていただきたいです。
そして、今週のゲームに移ります。
今週のゲームでは、モンスターが吠える3つの効果音をお聞かせします。
ElevenLabs、Pika Labsで効果音を提示し、また、株式音楽・効果音会社であるArtlistにも行って、モンスターが吠える効果音をダウンロードしました。
どれがどのツールから来たか教えていただきたいです。
準備はよろしいですか?
これが1番です。
これが2番です。
そして、これが3番です。
もし答えが分かると思われる場合は、この動画のコメントでお知らせください。
当選者の中から1人を無作為に選んで、Curious Refugeから無料のAI映画製作スウェットシャツを受け取ることになります。
先週出た研究論文には、Style Gaussianというものもありました。
研究ページにはかなりクールな例がいくつかあります。
基本的には、アップロードされた参照画像を取り込むことができます。
そして、そのスタイルをガウス分布に投影します。
それがクールな理由は、まもなくRunway Gen 1を使うのと同じように、スタイルを拡張現実に投影できるようになるからです。
Apple Vision Proにいると想像してみてください。周りを見渡すと、世界全体がアニメスタイルやPixarのスタイルに変換されています。
この初期の技術が目指しているのはそういうことです。
そして、インタラクティブエンターテイメントの未来には大きな影響を与えると思います。
先週、SMPTEの会長であるレナード・ジェンキンスとの新しいポッドキャストエピソードも公開しました。
お客様は、AIが基本レベルでどのように機能するか、そしてAIが生成したイメージにより良い表現を作成する方法について、本当に素晴らしい洞察を共有してくれました。
私たちはまた、デイヴ・クラークによる「Another」という短編映画を公開しました。
この短編映画は、実写映像とAIが生成したビジュアルを実際に組み合わせています。
そして、時々、何がAIで何が実写なのかがわかりにくいことがあります。
私たちは実際に、この新しいメディアをLiveGenと呼んでいます。
私たちは、これが映画の未来がどのようなものになるかのプロトタイプであると考えています。
Daveはプロジェクトで素晴らしい仕事をし、ロブ・ニーダーホルストのような本当に才能のあるアーティストと協力して、その作品のビジュアルエフェクトを作成しました。
ぜひチェックしてみることを強くお勧めします。
RunwayのCEOも本当にそれを楽しんだそうです。だから、おめでとう、デイブ。
それは本当に素晴らしい露出ですね。
また、OpenAIのCTOとのインタビューに出くわしました。Soraについて話しているそうで、タイムラインの更新があります。
実際、Soraは今年の後半にリリースされる予定で、実際には数ヶ月以内にリリースされる可能性が示唆されています。
彼はまた、Soraに音声を組み込む予定であるとも述べています。つまり、Pico Labs内で効果音を持っているのと非常に似ているかもしれません。
Soraは公共の人物を再現することはできないとも言っています。これはおそらく最善の選択ですね、特に選挙年であることを考えると。
そしてOpenAIについて話している際に、数分間だけリークされたページがありましたが、いくつかの人がオンラインで見つけました。
それは基本的にChatGPT-4.5 turboリリースページでした。
そして基本的に、2024年6月にリリースされる可能性が高いというヒントがあります。
私たちはそれを使うのを本当に待ちきれません。
そしてOpenAIについて話している際に、ちょっとだけ、サム・アルトマンが取締役会に復帰しており、11月の狂ったドラマの後、彼らは実際にXで見つけたこの本当に興味深いデモに出くわしました。そこでは、ロボットがOpenAIと統合され、世界を見回し、その周囲を解釈する能力を持っています。
デモでは、ロボットが周りを見回し、テーブルの上にリンゴがあると言うことができ、このロボットは多少人間らしいです。
技術の非常に興味深い使い方です。
もちろん、今後数ヶ月でこれがどのように進化するかを非常に興味津々です。
少し話を変えて、実際にグロックが今週からオープンソースになると発表したイーロン・マスクに移ります。
XがOpenAIに対してAIモデルをどのように位置付けているか、そして現在進行中の訴訟とどのように関連しているかを見るのは本当に興味深いです。
そしてこれで今週のAI映画に移ります。
今週の映画をお見せするのがとても楽しみです。
これまでこの番組で見た中で最高の映画のいくつかです。
最初のものはザヒール・カーンによる映画「The Mermaid」です。
これまでに見た中で最も信じられないようなショットがあります。
VFXはまさに息をのむほどです。
彼らは明らかに、ランウェイの中でモーションブラシツールを使っていくつかのショットを撮影し、素晴らしい仕上がりになっています。
そして、これはこれらのツールの中にあるいくつかの制限を回避する素晴らしい例だと思います。
彼らは物語の語り方に非常に堅実な理解を持っており、AIツールを使う際に発生するいくつかの課題を回避しながら情報を伝える方法を本当によく理解しています。
彼らは、Runway、Leonardo、Suno、ChatGPT、After Effects、Premiere、Artlistの組み合わせを使用したと言っていましたが、実際には私たちのプログラムの中でそれらのツールのほとんどを教えています。
AI映画製作者の中でも最高の人たちが、私たちのコミュニティと共に開発してきたいくつかのプロセスを使用しているのを見るのは素晴らしいことです。
次に紹介したい映画は、アンキャニー・ハリーによるUncanny Harrietです。
基本的には、Sunoの曲を使用したミュージックビデオで、ビジュアルにはRunway、Leonardo、そして口パクにはPika Labsを使用しています。
彼はまた、スタイル転送を追加するためにLensGoを使用し、その結果、これまでに見た中で最も説得力があり興味深いミュージックビデオの1つになっています。
そして、今週の最後の映画は、MarcoによるEscapeという作品です。
それは本当に素晴らしいキュレーションを特徴とし、基本的にはアイデアを探求するAIムード映画で、森の中にいるキャラクターが登場し、ピンクの煙が漂っています。
それは本当に素晴らしいミュージックビデオのコンセプトだと思いますし、彼らが映画のために正しいシーンを選んで選んだと思います。
では、今週のAI Film Newsのエピソードをお楽しみいただけたら嬉しいです。
もちろん、毎週月曜日にCuriousRefuge.comで購読することで、AI Film Newsを直接メールで受け取ることができます。
私たちはそのニュースレターでこの番組で話す以上のニュースをカバーしているので、最新かつ最高のニュースをお求めの場合は、ぜひ購読してください。
そしてもちろん、YouTubeで私たちにいつでも購読することができます。
このビデオを楽しんでいただけたら、いいねを押してください。
ご視聴いただき、ありがとうございます。
次回の動画でお会いしましょう。