ByteDanceより一貫性のある動画生成「StoryDiffusion」が発表される

2024年5月1日 17:20

ByteDanceと南海大学のインターンによる「StoryDiffusion」が公開されました。 Unetを使ってストーリー的につじつまの合ったセルフアテンションを実現しています。 ~~コードはまだ公開されていないようです~~
[5/4追記] コードとデモが公開されました！

Gradio公式Xで大きく紹介されています

🤯 𝐒𝐭𝐨𝐫𝐲𝐃𝐢𝐟𝐟𝐮𝐬𝐢𝐨𝐧 - Generates high-quality videos using consistent generated images or with user's input-images as a condition.

More examples and links below👇 pic.twitter.com/eZxOYjdbOV
— Gradio (@Gradio) April 30, 2024

以下公式リリースより

StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation
（ストーリー拡散長尺画像・動画生成のための一貫した自己アテンション）

Yupeng Zhou [1]* Daquan Zhou[2]† Mingming Cheng[1] Jiashi Feng[2] Qibin Hou
VCIP, CS, Nankai University 2ByteDance Inc.
ByteDance Inc.のインターン

コミックの生成

StoryDiffusionは、一貫した自己アテンションにより、印象的なコミックを作成することができます。

映像制作実績

StoryDiffusionが生成した一貫性のある画像や、ユーザーが入力した画像を条件として、画像セマンティックモーションパーディクターにより、高品質な動画を生成することができます。

ビデオギャラリー

・一貫した自己アテンションにより生成された画像
・SORAの条件画像を使用ユーザ入力条件画像の利用

漫画キャラクター生成

StoryDiffusionは、驚くほど一貫性のあるアニメキャラクター画像を作成することもできています

複数キャラクター生成

StoryDiffusionは、複数のキャラクターのIDを同時に保持し、一貫性のある画像を生成することも可能なようです

その他のコミック生成例

StoryDiffusionは、印象的なコミックを作成することができます。今後、より多くのコミックを生成して公開するそうです。

"女の子とリス"

アニメっぽい画風も得意そうですね。

手法・セルフアテンションの一致

モーション予測の構造

肝心の論文本体とGitHubについてはまだ公開されていませんが、このタイミングでの公開はSIGGRAPHなどの国際会議等での採択の可能性がありますね。
続報があればこちらの記事も更新していきたいと思います。

追記：GitHubとHugging Face Spacesにデモが公開されました

公式🤗 StoryDiffusionのGradioデモ
[重要] パーソナライゼーションステップ:

[1️] キャラクターのテキスト説明を入力します。Ref-Imageを追加する場合は、トリガーワード: imgでカスタマイズしたいクラスワードに続くことを確認します。
[2️] プロンプトの配列を入力します。各行は生成された1つの画像に対応します。
[3️] お好みのスタイルテンプレートを選択します。
[4️] [送信] ボタンをクリックしてカスタマイズを開始します。

🖼 StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation 🔥 Jupyter Notebook + @replicate 🥳

Thanks to Yupeng Zhou ❤ Daquan Zhou ❤ Ming-Ming Cheng ❤ Jiashi Feng ❤ Qibin Hou ❤

🌐page: https://t.co/bKuyGpChBr
📄paper: https://t.co/aPFbYmsQoa… pic.twitter.com/90GUdzzpHW
— camenduru (@camenduru) May 3, 2024

ここから先は

0字

AI用語集ライター

¥1,000 / 月

初月無料

日々生み出されていく生成AIの用語集をユニオンのメンバーみんなで編纂しています。メンバーは新規・公開前の用語集を閲覧できます。品質の高いエントリーを投稿したメンバーには謝礼をお送りしています。誰よりも早く品質の高い原稿を書いて社会に生成AIの品質の高い情報を伝えよう！

新規のAI用語を投稿できます（採用時は謝礼あり）
AICU Discord「クリエイターユニオン」への参加リンク
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

このメンバーシップの詳細

ログイン

この記事が気に入ったらサポートをしてみませんか？