AIでナレーション音声を作ってショート動画を作る【TTS】
こんにちは。
「生成AIを可能な限り取り入れて」ショート動画を制作している人です。
目的は
「溢れているAIサービスの中から本質的な即戦力を発見し、日々アップデートし続ける」ことです。
今回はナレーション音声、テキスト読み上げ(Text to Speech)の生成AIについて見ていきます。
1. テキスト読み上げツールについて
ぱっと出てくるところでもたくさんありますよね。
etc..
今回は、OpenAI TTS、実際どうなん?という所を見たかったので
実際に使用して、ショート動画の制作をしていきます。
「日本語は違和感がある。」
「外国人の日本語っぽいイントネーション」
これ系の口コミを見かけますが、果たして実情はいかに!
2. Open AI TTSについて
とりあえず概要を共有しますね。
安い($0.015 / 1000 文字)
6パターンの声質から選べる
2.1 費用について
今回6パターンの声サンプルを出して、更にショート動画1本分のナレーションを生成してみたのですが、Daily Costsは$0.01でした。1.5円くらい…?
2.2 6パターンの声質
alloy
fable
echo
onyx
shimmer
nova
この6種類です。
実際に聞いた方が早いと思うので、全パターン生成してみました。
お気に召したパターンはありましたか?
確かに、ちょっとイントネーションが外国人っぽさありますね。
実際動画にしてみると感じる違和感はどの程度なのか。
今回は、雑学・豆知識系のショート用ナレーションとして
渋めの声、onyx兄貴で行きたいと思います。
3. いざ、生成
順番に1つずつ生成していきます。
GPTsでショート動画用テーマ選定
GPTsで決定したテーマに沿った台本生成
GPTsで台本に沿った画像生成
OpenAI TTSで台本にそったナレーション生成
ということで、台本をぶち込んだだけでナレーションができました。
一部読み間違い箇所もあったので軽く修正だけしました。
(「放った」を「ほおった」と呼んでいたのでひらがな「はなった」に記載変更、など)
ということで出来たのがコチラ。
※一部自動文字おこしでテロップ間違いあります…!
どうでしょう。
「ん~ちょっと実用化厳しいレベルかな」
「意外といけてるか?」
…
人によって感想わかれそうではありますね。
個人的に、このナレーションで闘えるのか!?を確認したい感あるので
もうちょっとonyxをこすってショート出してみたいと思ってます。
動画編集 × AIを学ぶ同志の方いらっしゃいましたら、
フォローいただけると嬉しいです…!感謝の極み…!情報交換しましょう…!
かけだしのX(旧Twitter)アカウントは:こちらです。
この記事が気に入ったらサポートをしてみませんか?