AIによる動作制作(Stable Video Diffusion)を試してみた①

2023年12月20日 23:10

AIが画像や文章を生成できるようになったのは2023年の大きな話題となりました。そして2023年が終わろうとしている現在、ついにAIは動画の生成もできるようになりました。

画像から動画を生成できるメリットは様々です。クリエイターはもちろん、企業広告、販売戦略等、様々な面に大きなインパクトがあることは間違いです。

2024年も目が離せない生成AI革命。いったいどこまで進化が続くのかはわかりませんが、ざっと作ってみましたので是非ご覧ください。

今回は詳しい手法というよりもまずはどのような画像が生成でき、そこからどのような動画ができるのかを検証したいと思います。

静止画の作成

AIによる静止画の作成は様々な方法がありますが、私はDALL·E 3を用いて静止画を作成しています。

DALL·E 3はChatGPTの有料ユーザーが使用できます。ほか様々なツールがありますので、ぜひいろいろ試してみてください。私が以前試したツールですと「NovelAI」などがあります。

まずは３枚の画像を作成してみました。なかなか素晴らしい画像が生成できました。

いずれも素晴らしい画像が生成できました。これらを動画にした場合どのような変化があるかを検証したいと思います。

Stable Video Diffusionは静止画から動画を生成できるツールです。下記のサイトなども参考にしつつ、実際に画像を動かしてみました。

なるほど。最初の動画はやや微妙な結果でした。背景が動いていますね。目もやや充血している？

二番目の動画も同様ですが、背景が透けていていい感じです。神々しさがでていますね。

三番目の流星群はかなり良くできました。

成功度の多い少ないはあるとはいえ、いずれも動画を生成することができました。まだまだ研究途中ではあるとはいえ、かなりリアルな画像や動画が生成できそうです。

AIを活用しつつまとめてみると様々な用途に利用できそうです。

シュミレーション、広告、短編映画、研究目的など、まさに可能性は無限だと思います。
とても興味深く、新しい技術だと思います。
今後、すこし深掘りできたらと思っています。

画像生成にはこのような様々な可能性があります。が、リスクもあるのは事実。まずはこういった入門書で幅広く学ぶのもいいと思います。

動画の作成方法などは下記の本も読みました。

私はローカル環境でも実装しました。ただローカル環境だと比較的ハイスペックなGPUを求められるのでその点も含めてご案内できればと考えています。

この記事が気に入ったらサポートをしてみませんか？