見出し画像

「音声入力」が広がらなかった理由

2年前から去年くらいにかけて、一時期『音声入力』の言葉を頻繁に聞く時期がありました。

複数の著名な人が、同じくらいの時期に『音声入力いいよ!』という主張をして、たくさんのひとがそれに追随しようとしました。

ちなみに複数の著名な人というのは、けんすうさんとか勝間和代さんとか、野口悠紀雄さんとかです。


ただ、結局そこまで広まらなかった(広まってない)よなーというのが、ぼくの肌感です。

それで、どうしてかなーというのをうっすら考えてたんですが、一昨日、それっぽ仮説を思いつきました。


音声入力のメリットのひとつって、タイピングと比べたときのその『速さ』にあるんですけど、その『速さ』というメリットを享受できるだけの頭の回転力をもった人が、かなり限定されていたのではないかと。

というのも、話したことを文字に起こしたときにある程度読めるレベルの文章になっているのって、事前に頭のなかで構成を組み立ててないと行けないので、だいぶ難易度が高いんですよね。

『事前に組み立てる』と書くと頑張ればできそうな気もしますが、音声入力の難しいところは、それを『話す』ことと同時並行でやらないといけない点です。

原稿があるわけじゃなく、アドリブてそれなりに論理的整合性の取れた文章をある程度の分量話続けるって、かなり大変です。

実際、ぼくも当時何回かやってみましたが、ちょっと話したらすぐに言葉がつまって、無理に出そうとしたらすごい支離滅裂な文章になって、読めるレベルに推敲するほうが却って時間がかかりました。


なので、『音声入力』がもてはやされた当時、ちゃんとそのスピードを活かせる人たちにとっては、AI(人工知能)によって改良された音声認識精度はありがったかったでしょうが、大半の人たちにとって、音声入力を活用するにあたっての障害はそこではなかったんです。


...ということをカッコつけてツイートしたら、会社の先輩からリプライがきて、、、


ぼくは、見切りをつけるのが早すぎたのかもしれません。

若干話がズレますが、いわゆる五体満足の人は、普段の情報の8割以上を『視覚』から得ているそうです。

じゃあ、視覚になんらかの障害がある人の得ている情報量がすごく少ないかと言われるとそうではなくて、そういった人たちは代わりに触覚や聴覚、嗅覚なんかが鋭くなると聞いたことがあります。


なにが言いたいかっていうと、ぼくたちのからだはとてもつもないポテンシャルを秘めていて、迫られなければつい楽な方法で済ませてしまいがちだけど、やろうと本気で思えばやれるんじゃないかということです。

今日はすごいテクノロジーに関連した未来チックな話から、最後は根性論ぽい感じになってしまったんですけど、これから週に1回くらいのペースで音声入力も試していこうと思います。

最後まで読んでいただいて、ありがとうございます!!!すこしでも面白いなと思っていただければ「スキ」を押していただけると、よりうれしいです・・・!