見出し画像

[OpenAI]動画生成AIの専門家が見た開発競争[Sora]

 OpenAIより動画生成AI「Sora」(ソラ)が発表されました。このSoraという名前はなんと、日本の「空」から命名されたとか。うれしい限りですね!

ちなみに私は現役でAIの開発にも携わっているのですが、動画生成AIに関しては「ユーザーとしての自称専門家」です。そんな専門あるのかよって突っ
込まれそうですが(笑)。まずは自称専門家としての見解を述べさせていただきます。

Runway

 ます、先行するのはRunway社の「Runway Gen-2」。有料のサブスクですが、無料プランもありますので気軽に試せます。有料版では商用利用もできます。

 気になる料金とかは以下のサイトをご確認ください。分かりやすくまとまっています。

 Runway Gen-2については私は無料版、有料版を徹底的に試しました。かなりクオリティの高い動画を生成できます。人の動く方向、カメラのアングルまで指定できるほどの高性能動画生成サービスです。

 実はRunwayGen-2についてはかつてkindle本を出版しました。様々なAIツールを組み合わせてショートムービーを作成するという内容です。マンガなども入れまして高校生にも分かるくらいの難易度で書いたつもりですので、興味のある方はぜひご覧ください(宣伝スミマセン…)

 ただ、当たり前ですがプロンプトの与え方を失敗すると作画が崩壊します(笑)。私が魔物と戦う戦士といったプロンプトで作ったところ、戦士が魔物になってとんずらした動画ができてしまいました…。生成に失敗した恥ずかしい動画を置いておきますね…

Stability AI

 Stability AI社もStable Video Diffusionを発表しています。こちらは商用ではなく、研究目的で発表しているとのこと。特徴としてはこちらも動画生成は可能なものの、正直、RunwayGen-2ほど細かな設定はできません。ただ、このツールは手元の「オンプレ端末」で実装できてしまうことがすごいのです。
 ちょっと良いグラフィックボードがあれば、気に入った写真から動画を自分の手元の端末で生成できるというなんとも異色なツール。面白いですね。

 Stable Video Diffusionについては過去に記事を書いていますので合わせてごらんください。

他にもサービスを提供している企業がありますが、OpenAIがこの競争に加わることで、いよいよ動画生成サービスも競争が激しさを増しそうです。

Sora

 では、Soraのクオリティはどうなのか?あくまで記事を見る限りですが、クオリティは「かなり高い」と言えます。正直に言うと私が本で取り上げたRunwayGen-2以上です(本が売れなくなる( ノД`)シクシク…)

 いや~。まさかこれほどのものを見せられると参りましたとしか言えません。正直、感動です。女性が都会を歩いている映像がありますが、背景を自然に動かす能力に加えて女性の歩き方を見てください。足の運び方、腰回りの動きはほぼ「リアルな人」です。あくまで現時点での評価ですが。

重要なことは価格と使いやすさ

 では、SoraはRunwayGen-2より優れた動画が生成できるのかというと、そうとは言えません。まだ正式サービス前ということもありますが、よい動画が作れるかどうかはずばり、使いやすさが大きく影響します。
 
 動かしたい対象物を的確に、動かしたい方向に動かすことができるか、いかに人間側の指示を的確に反映させることができるかといった点が重要になってきます。
 
 また、価格面も気になるところです。RunwayGen-2より高いのか安いのか。簡単なものを作りたい場合は値段を安くしてほしいという思いもあるでしょう。

 後発となるSoraはRunwayGen-2を徹底的に研究するでしょう。その結果、両者が競い合い、よりよいサービスができることを期待したいと思います。

2024年はGPTsと動画生成AIの年になりそうですね。


この記事が気に入ったらサポートをしてみませんか?