見出し画像

英語の発音と音声認識の精度

みなさんこんにちは。
ワーホリ準備中の麻希亜です。

昨日の夜中、こんな音声投稿をしました。

英語の発音について、とあるブログを読んで
衝撃を受けた、という話。

そしてそのブログを読んで
やはり、英語の発音矯正はちゃんとやろう
と思った話。

発音強制の方法はいろいろあると思うのですが
最近よく見るのが

音声認識を使った発音チェック

具体的にはSiriやOK googleの音声認識機能で
英語を聞いてもらい
自分の意図した通りに、英語が認識されるかどうか

という方法です。

正確に言うと「矯正」ではないのですが
自分の発音が正しいかどうか知ることは
大切なことだと思うので
発音矯正をしたい人には便利な機能だと思っています。

ただ、ここで疑問が1つ。

音声認識が正しく判断できた英語は
ちゃんとEnglish nativeにも伝わるのだろうか。

日本語の場合は、人よりも音声認識の方が
聞き取ってくれないことが多いイメージで
会話をしていても問題ないのに
音声認識は正しく聞き取ってくれない
ということが多々あるように感じます。

それが顕著に表れるのが
YouTubeの自動字幕生成。

聞き流していても問題なく聞き取れる
日本人Youtuberさんの動画でも
自動生成の日本語字幕をつけると
呪文のような言葉が並ぶことも多いです。

(人によります。
あと、最近はそちらも精度が上がってきているように感じる。)

それを考えると、日本語の場合は
「音声認識で正しく認識されるなら
日本人に伝わると思って良い」
と言えると思います。

というかむしろ
「音声認識が聞き取れないからって
日本人に伝わらないわけではない。
(音声認識が聞き取れる日本語は
会話としてはやや不自然)」
でしょうか。

じゃあ英語はどうなの?という話。
調べてみたのですが、これに疑問を感じている人や
検証をした人は見つけられませんでした。

私の会社で、音声認識機能を搭載したシステムを開発しているチームがあるのですが
そこの人に言わせると
「英語に比べると、日本語の文章は
音声認識で聞き取ることがかなり難しい」
らしいです。
(それは発音のせいではなく、日本語は英語のように区切りがないから
らしいので、この記事とはあまり関連がないかもしれませんが…。)

とすると、英語の場合は日本語と逆で
「音声認識では認識されるけど
English nativeには伝わらない」
という現象が起きるのではないな、と思っています。

検証してみたいけど、その方法が思い付かないですね……。
音声認識と同時に、私の発音を聞いてディクテーションしてもらえばいいのか。
English nativeの友達ができたらやってみるかも。

もう少し調べてはみようと思うので
もし関する記事を見つけたら
また共有しますね。

それでは今回はこの辺で(’-’*)♪

頂いたサポートは、ワーホリの準備資金として活用させていただきます!