見出し画像

動画生成AI「Sora」 プロクリエイターによる短編作品が続々公開

編集局員のpsymenです。AI最新情報を読み解きます!


OpenAIがクリエイターのSora生成作品を公開

安全性検証のため、レッドチームとしてSoraのβ版検証を委託されたアーティスト達がいます
彼らがSoraを使って制作した動画作品が公開されました


CMのプリプロ制作

ショートフィルム制作

映画・MV制作

MV制作

XRクリーチャーの
プロトタイピングへの応用

デジタルファッションへの応用

デジタル彫刻への応用


いずれもすごいクオリティですね!
早く公開してくれ〜 Soraヤベ〜!!!

・・・んですが
Soraがスゴイのにはもう慣れてしまったので
作品制作における実用面からの正直な感想を言うと

『…あれ?プロが作っても「すごそうな印象映像の羅列」の域を出てこない??』でした

Diffusion Transformer(拡散トランスフォーマー)アーキテクチャーによる、個々の出力動画内におけるConsistency、つまり「対象物の形状の保持」「空間の保持」「時間の連続性」が卓越しているのはガチ確定しているのですが・・・

  • イマジネーション溢れるはずのプロ達が作っても、カット間のコンテクストやカメラワークが連続した映像作品がなく、ジャンプカットのつぎ合わせMVのよう

  • つまり、出力をまたいだキャラクターの同一性の維持、人物等の明示的な演技の指定はまだ全然できなそう

  • 「Soraで作った」とわかる共通の色調・フィルムグレインのテイストになりがち(60〜70年代のフィルムのようになる)

  • フライスルー系の映像はやはり突出して印象深いが…
    人物モーション系の生成AIが、激しめのダンス動画ばかりで一見すごそうに見える現象に近いのかも

  • いざ「人間の顔」をしっかりと生成しようするとガチャ大会になる可能性が高そう
    冷静に考えると、ここまで出てきた数十本の映像で人物がガッツリと演技しているものをほとんど見ていない(しかもなぜか老人ばかり)

↓こちらは4/3に追加で発表された長編のMVですが・・・

描画内容のConsistencyは凄いのですが…やはり基本的にはガチャ生成の羅列です

一番最初に出てきた「街を歩くSoraウーマン」、またはその後公開された「カフェでの男女の会話シーン」のような、人の演技で構成されたショートフィルムがバンバン出てくるのを勝手に想像していましたが、こういう映画的なシーンを自由に演出できる未来はまだ到来していないのかもしれません


また、
これはDall・EやGPTシリーズからも感じる事ですが、そもそもOpenAIはユーザーの思い通りのアウトプットを生成できる機能の提供にはかなり慎重です

これはクリエイティブ系のUX/UIの専門家の欠如というよりは、元々のサム・アルトマンらの思想として、AIの操作性をオープンにする事への警戒感がありそうです
(ビジネス戦略的な意味もあるかもしれませんが…)


となると、オープンネスがガバガバ開きっぱなしのStability AI社による同じく拡散トランスフォーマーモデルを採用したStable Diffusion3の登場が待たれるのですが、
Soraの生成クオリティは背後にあるMSの巨大な計算資源パワーで担保されているようなので、SD3が以前同様にオープンソース化されたとしても、当面は誰も十分な性能を引き出せないのかもしれません

Runwayを始めとする現状の動画生成AIにトークンを溶かしながら感じる「生成ガチャ」のモヤる感じはまだまだ続きそうな予感がしてきました


当面のSoraの使い道

サム・アルトマンの先日のインタビューでも述べていたように手堅く、ハリウッドへのアプローチを開始したとの報道もありましたが

「個人でも映画を作れる!」という旧来産業の民主化よりも、
作例に出てきたアレックス氏のデジタル彫刻やジョセフィン氏のデジタルファッションなど、時間軸を持った超高性能なビジュアル生成ツールとして新しい文脈での使い方を模索するのが正解かもしれない、となんとなく思いました



この記事が気に入ったらサポートをしてみませんか?