字幕付け支援アプリ、1か月運用結果

ゲーム実況などで字幕をつける「ゆかりねっと」の音声認識をレベルアップしたり、字幕付けを支援できるアプリ「ゆかりねっとコネクター」。

Google APIをつかう実験も兼ねていたので、その運用結果をまとめてみます。

1.ゆかりねっとコネクターとは

音声を自動的に文字に変換して、その声をボイスロイドにしゃべらせることで、美しい声に変えることができる「ゆかりねっと」というアプリがあります。

この「ゆかりねっと」ですが、Google音声認識をつかっているので、次の弱点があります。

・単語辞書登録ができない
・認識の得手不得手がある
・意図しないところで誤認識する

まぁ、これを愛嬌だと思って使っている人もいるし、単語置換などで一生懸命抑え込んでいるケースもあります。

んじゃぁ、「音声認識部分をもっといいものにしたらどうだろう?」と考えて、別の音声認識アプリを繋げられるようにしたのが「ゆかりねっとコネクター」です。

音声認識に定評があるUDトークをつかってみたらどうだろう?ってことでかんがえてみました。UDトークだとできることは…

・辞書登録して、誤認識を減らすことができる
・企業で利用される音声認識エンジンがつかえる(AmiVoice Cloud)
・翻訳ができる

また、「全世界で広がっているゲームをやるなら、字幕もつけたい」という声もあったので、英語も字幕生成し配信できるアプリを作ろう、ってことでこのあたりを研究することにしました。

2.設計をどうしようか

んじゃ、翻訳とかどうしようかなぁ、と考えたわけです。UDトークの画面をエミュレータで動かしてそのままつかってもいいけど、OBS Studioなどで合成しようとおもったら、やっぱり同じデスクトップ上にあってほしい。

ってことで、

・ゆかりねっとがなくても多国語字幕を出せるようにする
・UDトークをエミュレータで動かさなくても多国語の画面が撮れる

を目標に、実装することにしました。

UDトークで表示される翻訳文がそのまま扱えればいいのですが、そのあたりは大人の事情などがあるので、今回は文章を個別に翻訳にかけることにしました。

そこで、一定の評価がある翻訳エンジン、Google 翻訳をつかってみることにしました。

3.商用可能な構成

Google翻訳をつかうには、ブラウザ経由とAPI経由があります。無料で動いているアプリは、Google Chromeの機能をつかって、ブラウザ経由でうごいています。

これ、商用で使う場合とか、APIコール回数とかに制限がある(はず)なので、今後Vの方々の世界が広がり、収益化されていくと、このあたりもネックになっていくのかな?と思ってます。

なので、商用でもOKなAPI、音声認識・・・ということで運用できることを考えるわけですが、実際どれぐらいのコストがかかるのか?というところが知見もないわけです。持続可能性も検討しなきゃいけないし。

なので、まずは1か月実践してみることにしました。

4. 1か月の運用結果

年末にリリースしました。使われ始めたのは年始ってことで、30日間の結果です。

翻訳の結果、91万回の翻訳リクエスト。1/30時点では1ドル=109.53円ですから、1か月で 2,173円ってところです。

アプリをリリースして、認知が広がっていったので、後ろになるほど翻訳が使われているケースがおおいようです。

ちなみに、アクティブユーザさんは増えたり減ったり。ホームページに来てくれている人の半分以上は、ゆかりねっとコネクターに来てくださっています。

5. 寄付で賄えるかなぁ…?

今回、このコストは寄付で賄えるものなのか?という点もあって、もしお気持ちをいただける方がいたら、ぜひ寄付を!とコメントをかいてみました。

その結果として、6千円のご支援を頂くことができました。3名の支援者の皆様、まことにありがとうございます!

今回の運用結果が続くとしたら、現状は3か月は維持できます。でも、これが継続的に続かないと難しい点においては課題ですね。

もしかしたら「1か月100円ぐらいの課金で、みんなが少額負担することでケアできる」ぐらいの実装になっていれば、気軽に支援して維持できるのかな… とか、ふと思ってしまいました。このあたり、いろいろ支援方法の提案も考えていかなきゃなりませんね。

今後は、まあちゃんを商業導入してくれる企業が増えたり、支援してくれる人がふえたら、もっと維持できるかなぁ。(私としては、ゆかりねっとコネクターで儲けるつもりはなくて、API分が維持できればそれでよいとおもってます)

Windowsプラットフォームは、スマホとちがって課金プラットフォームが弱いので、しばらくはこのnoteへの支援で続けてみようと思いますが、なにかいいプラットフォームがあれば、ぜひ教えてください!

PIXIV FANBOXを教えていただいたので、そちらも開設しました。
 継続寄付の場合はnoteよりFANBOXのほうがお手間おかけしません。

6.まとめ

サスティナビリティ(継続可能性)の担保って大切だけど、クオリティが保たれるサービスをつかうと、そのあたりは難しくなるのだねぇ。

まぁ、ゆかりねっとコネクターは、なんとか赤字にならないようにしながら、配信ユーザさんの助けになれたらなぁ、と思っております。

ということで、もし気に入ったら、一緒に育てていただけると助かります!

※UDトークも、コンパクトプラン課金で商用利用ができるし、ゆかりねっとコネクターもgoogle公式APIを課金して動かしていますので、この組み合わせは収益化が可能になったYoutuberさんにも向いているかと思います。

※ゆかりねっとコネクターはまだまだ有名なソフトじゃないので、まずは、課金有無にかかわらず、いろんな方に使っていただきたいなぁ。

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

note.user.nickname || note.user.urlname

開発したり研究したりするのに時間と費用がとてもかかるので、頂いたお気持ちはその費用に補填させていただきます。

リアクションしてくれて ありがとう!
6

Mori Naoyuki

字幕・音声認識関連

ノートテイク、音声認識、文字通訳など、文字で音声を伝える関連の記事です。
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。