見出し画像

できる自動化・できない自動化を偉そうにそれっぽく語ってみよう

ホントのホントの最先端まではわかりませんが、巷で流行して企業が検討し始めた自動化ツールに関して、最近ちょっと触れていました。ので、ただのユーザー目線での所感でも。それを商売にしてるソリューションのプロ目線ではございませんので悪しからずご寛容ください。

感想

人間の仕事を奪って全てをやってくれるようになる。データを取り扱うのは得意だ。といっても、やはりお膳立てが必要であるとか、人はものすごく曖昧なものを理解できているのだなと改めて感じたりとか、どちらかというとそういう感想でした。

画像認識や文字認識、音声認識は、たしかに高性能で、驚くほど認識してくれます。

音声認識

テレビCMでやっているような「OK、Google!」はかなりしっかり認識してくれると思います。が、やはり狙って語りかけるからでしょう。

静かな部屋で打ち合わせをどれだけ認識できるか、googleドキュメントを音声認識で文字入力するモードにして、気を使わず普通に話してみました。

https://support.google.com/docs/answer/4492226?hl=ja

若干のケバ取りもしてくれて、魔法のように入力されていく様は未来でしたが、突然現れた専門用語などはやはり変換がうまくいきません。

面白かったのは自動化ツールのUIpathについて、普通に話すと「UIパス」と変換されますが、ちょっと流暢な英語風に(thなんかを意識して)話すと「UIpath」となったところです。雰囲気変えるだけでも違うものですね。

文字認識

そのuipathでのOCR機能を使った文字認識では、手書きまでは正確には読み込めません。そう考えると、人間はある程度汚い(癖のある)文字でも読んでしまうものですね。地名が入る欄だと予想できているだけで、たとえ記号のように見えても「あー品川って書いたんだろうな」というように。

画像1

人間は文字だと思っていても、機械はそもそも文字なのか図なのか絵なのかわからないですからね。象形文字もアラビア文字もハングル文字も読める人には読めるわけで、知らない人には「あ、文字なんだ?」となります。そう考えると手書きを読み込むのは無理だなと、感覚的に感じてしまいました。

また感想

今後どこまで自動化か進んで人間のような認識だできるようになるのか楽しみでもありますし、それが成し遂げられたとしたら、いよいよ人の優位性は感情ということになるのでしょうか。

もうよくわからないので寝ます。

寝るのも人間の営みで、人間の楽しみです。機械はパワーオフを楽しみにすることはないでしょう。



ちょっと役立ったなと思ったら、サポートいただけると嬉しいです。マウスを買い替える資金になります!