スマートスピーカーという音声合成が主役の機械

2021年5月5日 17:28

音声合成の使われ方は色々ありますが、昔からあったのは「人間の代わり」。

最近普及が伸びてるスマートスピーカーは「機械の存在で言葉を使う」の形。

大きな変化を感じてます。

聴く側から見るとかなりの違いになるのですが、深掘りしてみます。

人間の代わり、に求められること

これまで人間が行なっていた業務を音声合成が代行する、という代行形。

聴く側から見てみると、相手は「人間」です。

上流には組織や会社などそれを提供してる存在があります。この存在のメッセージを人間が伝えるのです。

なので、言い間違いも、噛むことも、聴こえにくいことも全部、提供側、もしくはフロント業務として伝える担当者の「不具合」になります。

期待されるのは、はっきりしっかり要件を伝えてくれること。面白いイントネーションで笑ってくれません。

これは、答えてる主体は本来なら上流のGoogleさんやアップルさんや提供する会社。でも、彼らは分かってます。擬似人格が色々な事を解決する、という事を。

声の主に名前を与えているのです。これにより、合成ならではの期待したのと違う読みに関しては、後ろの会社に文句は行きません。

さらに、Siriやアレクサや羊のコンシェルジュにも文句は行きません。そもそも「面白い読みをすることもあるんでしょ？」ということが共有されてるので。

鬼滅の刃を「おにめつのは」と読むらしいです。

この子なら許される？

使い方によってここまでの違いが出る例です。

代行的な使い方もそれなりに便利ですが、人間によるサービスを予想してたところに機械が登場すると、「人間の劣化版」。

それまでピーとしか反応しかできなかった機械がしゃべったら、「機械すげー」です。

ジャイアンが雨の降ってる時に捨てられた子猫の箱に傘をかけてあげたら「本当は心が優しいんだ」的な事を言われ、たまにむしゃくしゃしたことがあって花壇の花を思わず蹴っ飛ばしたシズちゃんが「日ごろいい子なのに本当は悪い子」的な事を言われるのと似ていますか？長い割に違いますか。

なので、仕事で音声合成について検討したり、検討してもらうときは、後者の「機械のくせにやるじゃん！」と思ってもらえる立ち位置を用意する事を勧めてます。

Siriやアレクサという姿のない主体だけでなく、しゃべってコンシェルのように、羊の執事のキャラを用意してるのは、使い手がその事を分かっているからです。

少し概念的な話になりましたが、体験してみるのが一番分かりますね。実際、多少のやり取りでおかしなことが起こっても確かにイライラしません。

まだまだ色々と書きたい記事もあります。金銭的なサポートをいただけたら、全額自分の活動に使います！そしたら、もっと面白い記事を書く時間が増えます！全額自分のため！