見出し画像

【仕事】わざわざ「生身の人間」が喋る意味

手間をかけるところには意味がある。

最近の音声合成はすごい

DX(デジタルトランスフォーメーション)関係のプロモーションや教材などで社内に動画配信をしたり、e-Learningを動画で収録したりを行うことがあります。その際にプレゼン内容を示しつつ、ナレーションや説明を入れる場合、人手で実際に喋って収録することもありますが、最近はAIナレーションの合成音声でもそこそこ聞けるものが増えてきました。

最近は何がすごいかというとテキストを単に棒読みをするわけではなく、ある程度抑揚をつけたり、自然な話し方に調整できるようになっていたり、ものによっては存在する人間の声を学習してその人の声を合成して読み上げをしたりもできます。

このような合成音声のメリットは、スクリプトさえちゃんと作っておけば噛んだり読み違いをすることがありません。また、パラメーターをいじればピッチを変えたりもできますし、万が一スクリプトを変えたとしてもすぐに撮り直しができます。人間だと収録した後の調整は難しいですし(もちろん後処理で調整は多少はできますが)、そもそもスクリプトを変更した場合にはイチから撮り直しになります。

生身の人間が喋るのが良い場合もある

音声合成でのナレーションはとても便利です。なのであらゆる説明動画や教材動画は合成音声でいいじゃんと思っていました。しかし、一概にそうとも言えないケースもあります。

一つ自分の経験を挙げると、過去にリーンスタートアップ的に価値探索を行っていたとき、アーリーアダプターへのインタビューのために、サービスの概要を動画プロトタイプとして収録をしました。その際、無料で使える合成音声を使って動画を作ったのですが、メンターの方にダメだと指摘をいただきました。

その理由は、合成音声にしてしまうと人間の声に現れる熱量が失われるとのこと。下手でも詰まっても良いので、そのサービスや事業を提案しようとしている人が、本気度を込めて一生懸命自分で話していることが大事だということを教えていただきました。そのため、私は自宅の部屋を閉め切って、自分のPCマイクに下手ながら何度も撮り直ししながら動画プロトタイプを作り直したことがあります。

確かに仰ることは私も指摘を受けて気づけました。「正確に、綺麗に伝えるべきでは?」と思う人には本質的ではないかもしれないですが、本気でやりたい人が自分の声で伝えようとする思いは、声の質感に込められ、やはり聞いている方も気持ちが高ぶる感じがあります。

最初の方に書いたDXを社内で推進したいという人たちも、流行りのDXをクールにやっているのではなく、手に汗かいて綺麗にできていなくても本気でやろうとして、誰かの言葉を借りたものではなく、自分達のものにして伝えようとすることは、その生身の人間である本人の口から伝えることで、ある程度、人間の心にささることができると思います。

そのため、自分の声で収録して編集するという手間のかかる作業ではあるのですが、音声合成のナレーションは使わない方向でやっていきたいと思っています。

これもケースバイケースで使い分け

だからといって、音声合成のナレーションを否定しているわけではありません。
ある程度、伝えたいことが社内で認知がされてくれば人間ではない音声合成の動画でプロモーションをしても良いと思っていますし、人間のナレーション、音声合成のナレーションを織り交ぜてもよいとも思っています。

自分たちのプロモーション活動や教育活動の段階によって、最初が大事だよねというところは人間による手間をかけた熱量のあるナレーション、多くの人に手軽に伝えたいことや更新頻度が多そうなものについては音声合成のナレーションを使うなど、ケースバイケースでうまく使い分けはできそうだなと思っています。

この記事が気に入ったらサポートをしてみませんか?