見出し画像

Style-Bert-VITS2 のAPIで複数話者の会話【台本はChatGPTに書いてもらおう】AITuber制作の備忘録

Style-Bert-VITS2

以前の記事でも書きましたが「Style-Bert-VITS2」は、感情や発話スタイルを自由に強弱をつけて制御できる上に、モデルの学習やマージも可能なツールです。

せっかく抑揚のある発話が可能なので、会話形式のプログラムを作ってみました。ゆっくり解説のようなイメージですね。

今回の成果物は以下の通りです。


台本は以下のようなもので、これはChatGPTのGPTsを使って作成しました。
最初のセリフを与えて、2人の会話形式で文章を生成してもらいました。

どうして人は牛とか豚は食べるのに、犬と猫は保護とか言うの?動物によって差別してるよね?
ほんまやな、その話題は色々と考えさせられるわ。まず、文化や習慣の違いが大きいと思うで。例えば日本や欧米では犬や猫をペットとして飼う文化があるから、それらの動物は家族のように感じられることが多いんや。それに対して、牛や豚は長い間、食料として飼われてきた背景があるんやな。
そうなんだよね、文化の違いって大きいのかも。
せやな。それに、国や地域によっては犬や猫を食べる文化もあるし、逆に牛を食べない文化もあるわけや。要は、その地域の歴史や宗教、価値観が関係してるんや。
文化や価値観の違いか。確かに、そう考えると納得がいくかも。
そうやろ?それに、人間の感情も関わってくるで。犬や猫は愛情を表すことができるし、人間との強い絆を築くことが多いから、家族の一員みたいに思われることが多いんや。
うん、ペットとしての愛着があるから、保護されるのかもしれないね。
そうやな。でも、牛や豚も感情はあるし、賢い動物やという研究結果もあるで。動物による区別は、実はかなり複雑な問題やねん。
確かに、そう考えると複雑だね。
それに、最近では動物の権利についてもっと考えるべきやという意見も増えてきてるし、ベジタリアンやヴィーガンのように、全く動物を食べない選択をする人も増えてるんや。
動物の権利について考えることも大切なのかもしれないね。
せやな、動物をどう扱うかってのは、文化や倫理、環境問題にも関連してるから、これからもっと議論されていくやろな。
じゃあ、動物の権利って具体的にはどういうことを指すの?
ええやん、深い話になってきたな。動物の権利ってのは、動物が苦痛を感じないようにするとか、適切な生活環境を保証するといったことやな。つまり、動物が適切に扱われ、必要なケアを受ける権利のことや。
なるほど、動物にも適切な扱いが必要なのか。
せやな。例えば、動物を飼うときは十分な空間や食事、医療ケアが必要やし、工場での飼育では、動物がストレスを感じないようにする工夫も重要や。
それは動物福祉っていうのかな?
その通りや。動物福祉とは、動物が健康で快適に生活できるように配慮することや。これは食肉用の動物だけやなく、実験動物やペットにも当てはまるんや。
動物福祉を考えるのは、人間にとっても大切なの?
もちろんや。動物福祉を守ることは、動物を尊重するだけやなく、人間の倫理観にも関わってくるんや。例えば、動物が不適切な環境で育つと、人間の食品安全にも影響があるし、環境問題にもつながるんや。
そういう繋がりがあるのか。
そうや。それに、動物を大切に扱う文化は、社会全体の共感力や優しさを育てるとも言われてるで。
社会全体に良い影響を与えるんだね。
せやな。動物をどう扱うかって問題は、ただの個別の問題やなくて、社会全体、時には地球規模の問題にもなり得るんや。
地球規模の問題か…。確かに、動物の権利を考えることは、広い視野で物事を見ることにも繋がるのかもしれないね。
そうやで。だから、動物の権利や動物福祉について考えることは、私たち人間にとっても重要なんや。
なるほどね。もっと色々な角度から動物のことを考えてみようと思う。
ええ考えや。動物との関わり方を見直すことで、人間自身の成長にも繋がるからな。
じゃあ、食文化の変化はどう影響してるの?ベジタリアンやヴィーガンが増えてるって話だけど。
それはまた別の大きな話やな。ベジタリアンやヴィーガンが増えることで、動物製品を使わない食生活が注目されてきてるわけや。これは動物の権利を尊重するという面だけやなく、環境保護や健康にも関係してるんや。
環境保護にも関係あるの?
せやで。例えば、肉を生産する過程では、温室効果ガスの排出が多いんや。牛や豚を飼育するのには大量の水や飼料が必要で、それが環境負荷になってるんやな。
なるほど、肉の生産が環境に影響してるんだね。
そや。だから、植物ベースの食生活を選ぶことは、地球温暖化の対策にもつながるわけや。
健康面ではどうなの?
健康面ではな、肉を減らして野菜を多く取ることで、心臓病や糖尿病などのリスクを減らせると言われてるんや。植物ベースの食事は、全体的に脂肪が少なく、食物繊維が豊富やからな。
健康にもいいんだね。
そうやで。でも、ベジタリアンやヴィーガンになるには、栄養バランスをしっかり考えなアカンで。特に、ビタミンB12や鉄分など、動物性食品から得られる栄養素に注意が必要や。
栄養バランスも大切なんだね。
せやな。食文化の変化ってのは、ただ単に食べるものを変えるだけやなくて、環境や健康、倫理など、いろんな要素が絡んでくるんや。
食文化の変化が、こんなに多方面に影響を与えてるなんて、思ってもみなかったよ。
世の中、意外と繋がりがあるもんやで。自分の食べるものがどう生産されているか、どんな影響があるかを知ることも大切やな。
今日は動物の扱いや食文化について色々学べたね。
せやな、動物の権利や動物福祉、環境問題や健康に至るまで、いろんな角度から話ができたわ。
文化や個人の価値観、健康や環境との関連性も考えさせられたよ。
そうやね。私たちの選択一つ一つが、意外と大きな影響を持ってるってことがわかるわ。食べ物の選び方一つ取っても、それがどんな意味を持つか考えることが大切やな。
うん、毎日の選択が大切なんだね。色々考えるきっかけをくれてありがとう。
いつでも歓迎やで。何か他にも話したいことがあったら、いつでも聞いてや。
ありがとう、また話そうね。
おう、待っとるで!人生も食事も、色んな発見と楽しみがあるんや。自分らしく、一歩一歩楽しんでいってや。
そうするよ。じゃあね、またね。
またな!気をつけてな!

実装で、少し苦労した点は、「Style-Bert-VITS2」で話者を1つのモジュールに複数人を設定できなかったことです。この問題の解決法は最後までわからなかったので、結局【1人の話者に対して「Style-Bert-VITS2」のモジュールを1つ割り当てる】というゴリ押しな方法で実現しました。今回の話者は2人なので、2つのモジュールを使用しています。

読み上げに関しては、台本となるテキストファイルの奇数行を話者01、偶数行を話者02が読み上げる形式で作りました。


成果として

GPTsを用いてやや長めの台本(5~10分の内容)を1つのプロンプトから生成。台本を用意すれば、複数の話者による会話を素早く生成することができました。
台本の口調や話者の性格もGPTsのプロンプトでコントロールできますし、台本をあらかじめ用意しておくことで、リアルタイム性が必要でない場面でのChatGPTのAPI料金の節約にもつながります。2人だけでなく3人以上での会話も可能ですね。

また、会話形式のコンテンツや情報発信に活用できそうだと思いました。
今回も読んでいただき、ありがとうございます。

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?