見出し画像

AIによる動作制作(Stable Video Diffusion)を試してみた①

AIが画像や文章を生成できるようになったのは2023年の大きな話題となりました。そして2023年が終わろうとしている現在、ついにAIは動画の生成もできるようになりました。

画像から動画を生成できるメリットは様々です。クリエイターはもちろん、企業広告、販売戦略等、様々な面に大きなインパクトがあることは間違いです。

2024年も目が離せない生成AI革命。いったいどこまで進化が続くのかはわかりませんが、ざっと作ってみましたので是非ご覧ください。

今回は詳しい手法というよりもまずはどのような画像が生成でき、そこからどのような動画ができるのかを検証したいと思います。

静止画の作成

AIによる静止画の作成は様々な方法がありますが、私はDALL·E 3を用いて静止画を作成しています。

DALL·E 3はChatGPTの有料ユーザーが使用できます。ほか様々なツールがありますので、ぜひいろいろ試してみてください。私が以前試したツールですと「NovelAI」などがあります。

作成した画像

まずは3枚の画像を作成してみました。なかなか素晴らしい画像が生成できました。

都会的な神々しい女性をイメージした画像 神々しいです。


都会のストリートで撮影した日本人女性をイメージした画像 写真のようなリアルさ


ふたご座流星群をイメージした画像 

いずれも素晴らしい画像が生成できました。これらを動画にした場合どのような変化があるかを検証したいと思います。

Stable Video Diffusionによる動画生成

Stable Video Diffusion のご紹介 — Stability AI Japan

Stable Video Diffusionは静止画から動画を生成できるツールです。下記のサイトなども参考にしつつ、実際に画像を動かしてみました。


動画①


動画②


動画③

なるほど。最初の動画はやや微妙な結果でした。背景が動いていますね。目もやや充血している?

二番目の動画も同様ですが、背景が透けていていい感じです。神々しさがでていますね。

三番目の流星群はかなり良くできました。

成功度の多い少ないはあるとはいえ、いずれも動画を生成することができました。まだまだ研究途中ではあるとはいえ、かなりリアルな画像や動画が生成できそうです。

この技術を何に使うか?

AIを活用しつつまとめてみると様々な用途に利用できそうです。

  1. コンテンツクリエーション:

    • 短編映画やアニメーションでのストーリーテリング。

    • ソーシャルメディアでの視覚的なコンテンツの作成。

  2. 教育と学習:

    • 教育的な動画での歴史的、科学的な現象の再現。

    • 学生や研究者による実験やプロジェクトのビジュアライゼーション。

  3. 広告とマーケティング:

    • 商品やサービスのプロモーション動画の生成。

    • ブランドのアイデンティティを強化するストーリー性のある広告キャンペーン。

  4. エンターテインメントとアート:

    • 音楽ビデオやアート作品の創作。

    • デジタルアートの展示やインタラクティブな体験の提供。

  5. ゲーム開発とVR:

    • ゲーム内のカットシーンや背景動画の生成。

    • バーチャルリアリティ(VR)や拡張現実(AR)でのインタラクティブな体験の開発。

  6. 研究と開発:

    • 人工知能や機械学習の研究でのデータセット生成。

    • シミュレーションや予測モデルの視覚化。

  7. 個人的な用途:

    • 個人の思い出やイベントの動画の作成。

    • ソーシャルメディアでの個人的な表現やストーリー共有。

シュミレーション、広告、短編映画、研究目的など、まさに可能性は無限だと思います。
とても興味深く、新しい技術だと思います。
今後、すこし深掘りできたらと思っています。

画像生成にはこのような様々な可能性があります。が、リスクもあるのは事実。まずはこういった入門書で幅広く学ぶのもいいと思います。

動画の作成方法などは下記の本も読みました。

私はローカル環境でも実装しました。ただローカル環境だと比較的ハイスペックなGPUを求められるのでその点も含めてご案内できればと考えています。


この記事が気に入ったらサポートをしてみませんか?