見出し画像

AIを使ったリアルタイムボイスチェンジャー(MMVC)使い方

(2022年12月18日版)
今後内容が変更されてることも多いのでおおまかにだけ

https://www.pakutaso.com/20131048276post-3340.html

■MMVCとは

MMVC(RealTime-Many to Many Voice Conversion)という
AI学習を繰り返してリアルタイムで喋りながらずんだもんとか(正確にはITAコーパスに従った音声ファイルがあるキャラクター)の声が出せる機能だよ

声がずんだもんだけどイントネーションで地声感が出ちゃうから
本格的にずんだもんになりたいときはずんだもんになりきって喋ってね

■ITAコーパスとは

ボイロとか音声合成用の元になる音素の詰め合わせだよ
中身は著作権完全フリーの文章がずらっと
最低100文最高424文(音声ファイルが多いほど学習精度が高くなる)

今回は録音ソフトを使って100文読み上げて音声ファイルを作ったよ大変だったよ

ボイスロイドになりたかったら100文~読んだwavファイルをboothかなんかに出してね

■導入手順

公式辿ってね
動画の方はサイトでは補えない部分だよ

※バージョン変わってほんのちょっと仕様変更してるけどjsonからconfに拡張子変更されているくらいで中身は同じファイルだからそのままコード編集してね

※自分のパソコン環境によって指定パスを変える必要があるので
CドラDドラの間違いやG2000.G4000の間違いに気をつけてね

■おおまかな導入内容

まずはじめに

自分のgoogleドライブにダウンロードしたファイル
それとITAコーパス音声ファイルや自分の声を投げて
colab起動して学習させるよ

Colaboratory導入はgoogleドライブの機能として入れられるから調べてねgoogleの用意するブラウザ上でpythonが走らせられる便利ツールだよ

pythonコードはすでに書かれているので説明を読みながら左[ ]内の再生ボタンを上から順に押してコードを再生していくだけだよ

学習させたファイルはGxxxxxやDxxxxxの形で保存されて学習させるごとに番号が高くなっていくよ

途中で学習中断することもできて学習再開させるときは番号の多い方を参照して再開するからかならず多いG.Dファイルは取っておいてね
1つ500Mくらい容量があるからドライブの容量見ながら削除していってね

学習には1日の限界があるみたいだから毎日ちょっとずつ育てていってね
複数アカウントで倍学習させられるけどめんどくさそうだよ

学習ファイル取得後

学習ファイル(Gのみ)と設定ファイルをパソコンにダウンロードして
専用ソフトもダウンロードしてきてフォルダに入れて使ってね

フォルダはドライブ直下にしてやるとパス指定が楽だよ

フォルダ内のマイクスキャンプログラム起動してjsonファイルのコードをいじってマイク設定と学習ファイルなどのパスを指定したら
あとは本プログラム起動して喋るだけでループバックでずんだもんの声が流れるよ
詳しくは動画に全部書いてあるから見てね

以上だよ
 

この記事が気に入ったらサポートをしてみませんか?