見出し画像

AIでナレーション音声を作ってショート動画を作る【TTS】

こんにちは。
生成AIを可能な限り取り入れて」ショート動画を制作している人です。

目的は
「溢れているAIサービスの中から本質的な即戦力を発見し、日々アップデートし続ける」ことです。

今回はナレーション音声テキスト読み上げ(Text to Speech)生成AIについて見ていきます。


1. テキスト読み上げツールについて

ぱっと出てくるところでもたくさんありますよね。

  • VOICEVOX(ずんだもんとか。)

  • CapCutの読み上げ機能(TikTok御用達)

  • 音読さん(ブラウザお手軽)

  • GoogleやMicrosoftのTTS

  • OpenAI TTS

etc..
今回は、OpenAI TTS実際どうなん?という所を見たかったので
実際に使用して、ショート動画の制作をしていきます。

イントネーションは果たして…!?

日本語は違和感がある。
外国人の日本語っぽいイントネーション
これ系の口コミを見かけますが、果たして実情はいかに!

2. Open AI TTSについて

とりあえず概要を共有しますね。

  • 安い($0.015 / 1000 文字

  • 6パターンの声質から選べる

2.1 費用について

今回6パターンの声サンプルを出して、更にショート動画1本分のナレーションを生成してみたのですが、Daily Costs$0.01でした。1.5円くらい…?

2.2 6パターンの声質

  • alloy

  • fable

  • echo

  • onyx

  • shimmer

  • nova

この6種類です。
実際に聞いた方が早いと思うので、全パターン生成してみました。

お気に召したパターンはありましたか?

確かに、ちょっとイントネーション外国人っぽさありますね。
実際動画にしてみると感じる違和感はどの程度なのか。

渋い男、onyx(created by Firefly)

今回は、雑学・豆知識系ショート用ナレーションとして
渋めの声、onyx兄貴で行きたいと思います。

3. いざ、生成

順番に1つずつ生成していきます。

  • GPTsでショート動画用テーマ選定

  • GPTsで決定したテーマに沿った台本生成

  • GPTsで台本に沿った画像生成

  • OpenAI TTSで台本にそったナレーション生成

ということで、台本をぶち込んだだけでナレーションができました。
一部読み間違い箇所もあったので軽く修正だけしました。
(「放った」を「ほおった」と呼んでいたのでひらがな「はなった」に記載変更、など)

ということで出来たのがコチラ。
※一部自動文字おこしでテロップ間違いあります…!

どうでしょう。
「ん~ちょっと実用化厳しいレベルかな」
「意外といけてるか?」

人によって感想わかれそうではありますね。

個人的に、このナレーションで闘えるのか!?を確認したい感あるので
もうちょっとonyxをこすってショート出してみたいと思ってます。

動画編集 × AI

動画編集 × AIを学ぶ同志の方いらっしゃいましたら、
フォローいただけると嬉しいです…!感謝の極み…!情報交換しましょう…!

かけだしのX(旧Twitter)アカウントは:こちらです。

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?