人工知能、深層学習、ビッグデータ解析の限界は?

昔、ビッグデータ解析の専門家が来て。水耕栽培でビッグデータ解析を行い、植物の生育を最大化する条件を見つけたい、と言ってきた。私は無駄だからやめておいた方がよい、と言った。私がビッグデータ解析や深層学習のことを知らないと思って、いろいろ説明してくれた。一応ひととおり聞いたうえで。

「やっぱりうまくいかないでしょう」と申し上げた。なぜか、とまた説明を始めようとしたので「まあ、ちょっと聞いてください」。「ビッグデータ解析や深層学習で必要なデータは、植物が大きく育つ、という目的のために集めるんですよね?」と尋ねた。うなづいてくれた。

「たとえば人間の健康診断で、肝臓が悪いかどうかを調べるために、足の大きさを分刻みで計測するビッグデータ解析するとしたら?おそらく、足の大きさのビッグデータでは肝臓が悪いかどうかを判断できないでしょう。足の大きさは、肝臓の健康と連動しているパラメーター(数字)ではないからです。」

「そして、水耕栽培でとれるデータは、pH(アルカリ性か酸性か)とEC(イオンがどのくらい溶けているか)くらい。しかもセンサーの精度がさほど高いわけではありません。この二つのデータをビッグデータ解析しても、足の大きさで肝臓の健康度を評価しようという努力に似てきます。」

「ビッグデータ解析するなら、植物の生育と関連がありそうなパラメーター(数値)を見つける必要があります。肝臓の健康度はγ-GTP値で評価するように。しかし悲しいことに、水耕栽培で、リアルタイムにとれそうなデータって、pHとECくらいしかないんです。そもそも選択肢がない。」

「pHもECも数字の揺らぎが大きいセンサーなので、ノイズが大きいデータになるでしょう。ビッグデータ解析したくても、植物の生育と連動するパラメーターを見つけられない限り、ノイズをムダに解析するだけに終わる恐れがあります。まずは適切なパラメーターを見つけることから始めなければ」

日経エレクトロニクスを読んでいると、ビッグデータ解析するのに、とりあえず何でもいいからデータを沢山集積すればいい、という話が当初あったけれど、ノイズのデータが多すぎるとマシンパワー食うばかりでうまくいかなかったらしい。やっぱりな、と思った。

私は、人工知能や深層学習、ビッグデータ解析の原理とかは十分にはわかっていない。ただ、解析事例を紹介している記事や今後の課題みたいなのを読んでいると、できそうなこととできなさそうなことは見当がつく。そういう意味では、人間って、すごい深層学習システム持ってるな、と思う。

この記事が気に入ったらサポートをしてみませんか?