見出し画像

D-ID社の技術を使用し音声を読み込ませて画像を喋らせる動画を生成

初めまして、みずぺーといいます。
このnoteを機に初めて私を知った方のために、箇条書きで自己紹介を記述します。

  • 年齢:28歳

  • 出身:長崎

  • 大学:中堅国立大学

  • 専門:河川、河川計画、河道計画、河川環境

  • 転職回数:1回(建設(2年9か月)→IT系年収100万up(現職3か月))

  • IT系の資格:R5.4基本情報技術者試験合格💮

本日はD-ID社のツールの一つである、Digital Creations for Human Imaginationsを用いて画像を自動で動かし遊んでみます!

結論今回作成した動画はこちらとなってます。

D-IDとは

D-ID’s Generative AI enables users to transform any picture or video into extraordinary experiences. Our technology is used by creators, leading marketing agencies, production companies, and social media platforms around the world. We are on a mission to enable full video production, using just AI.

https://www.d-id.com/

とD-ID社のホームページに書かれてあります。

つまり要約すると、「AI技術を駆使して動画を作成しちゃおう!」ってことですね。

今回は無料でD-ID社の技術の一つ「Digital Creations for Human Imaginations」を使用し、読み込ませた画像をあたかも喋っているかのようにします。

Digital Creations for Human Imaginationsのツールは

Use the latest generative AI tools to create talking avatars at a click of a button using the Creative Reality™ Studio

Supercharged with Stable Diffusion and GPT, the self-service studio lets you turn your ideas into stunning videos that are personalized, cost-effective and engaging.

Reduce the cost and hassle of video production, at scale, in over 100 languages, with zero technical knowledge.

https://studio.d-id.com/

ボタンクリックで画像を喋らせるように加工できる技術だそうです。

もし同じように喋らせた動画を作成したい場合には以下のリンクからログインしてください。

動画を生成してみた

今回使用する画像は私のトップがです。


みずペーのトップ画

こちらの画像をD-IDを用いて動画に加工してみましょう。

手順としては

  • https://studio.d-id.com/editor

  • Create videoをクリック

  • ADDボタンをクリック

  • Scriptで文章、言語、声のモデルを選択

  • 右上のCreate Videoをクリックして動画を作成

Create videoをクリック

まずはCreate Videoボタンをクリックして動画を作成を選択

Create Videoをクリック

ADD ボタンをクリック

ADDボタンをクリックして自分が読み込ませたい画像を選択

ADDで読み込ませたい画像を選択

Scriptで文章、言語、声のモデルを選択

文章、言語、声のモデルを選択

画像右で自分の理想のモデルを選択

右上のCreate Videoをクリックして動画を作成

右上のGenerate Videoを選択して動画を生成

Generate Videoで動画を生成

動画生成の際の留意点

動画を生成するときには動画の長さにはよりますが、無料で作成することができます。

が、20Creditまでとなってます。

おおよそ20秒=1Creditで生成できるので、400秒間は無料で動画を作成できる計算です。

最後に

今回はD-IDを用いて画像から動画を作成してみました!

5月現在D-ID社は新たな技術を公開してます。

chat.D-ID is a web app that uses real-time face animation and advanced text-to-speech to create an immersive and human-like conversational AI experience. The free app lets you speak face-to-face with ChatGPT.

https://www.d-id.com/

Chat-GPTを用いてイラストと会話することができる技術。

これからこちらの技術も使用してどんなビジネスに活かせそうかを実験してみます。

D-ID社の新技術

この記事が気に入ったらサポートをしてみませんか?