リクルートのデータ分析が美しい

最近話題になった記事が三つ。

「エレベーター渋滞」を改善したリクルートの超アナログな方法
「会議室不足」を改善したリクルートのアナログな方法
「トイレの混雑」を改善したリクルートの超アナログな方法
(それぞれ、2019/3/27, 4/17, 5/15, DIAMOND ONLINE

リクルートと言えば、データサイエンティスト界隈では知らない人はいない、日本の若いデータサイエンティストを投網で根こそぎ攫っていく会社ですが(ほめています)、これらの記事にあるように、こういうところが、こういうところこそ、データサイエンスだなと思います。

もちろん、めちゃめちゃ難しい理論や、最先端のライブラリを駆使してすごいことを瞬時にやってのけることもデータサイエンスの醍醐味ですけれども、こういう地味な取り組みがあってこそ派手さも活きるもので、データ分析は90%のデータクリーニングと9%のデータサイエンスと1%の気づきでできていますが、まさに90%の地味な取り組みが改善に繋がるお手本のような取り組みです。

もうちょっとちゃんと解説すると、とかくデータ分析は、今ここにあるデータで何かしたいと思うことが多いですが(特にビッグデータの流行以降)、歴史的にはそちらの方がマイナーで、本来は何か課題があって、その課題を解決するためにデータを集める方が正しいデータ分析の姿勢です。上の二つの課題、①エレベーター渋滞の解消、②会議室不足の解消、これらの課題のために実施したのは、①エレベーターの利用方法をいろいろ変えてみて時間を計測する、②会議室の椅子にセンサーを仕込んで利用され方を計測する、つまり、仮説を検証するために必要なデータを収集するというアクティビティです。つまりデータ分析とは、今ここにあるデータを分析することではなくて、課題解決のためにどういうデータを用意すべきかを考えるところから始まっています。それがデータサイエンティスト本来の姿勢ですし、「今あるデータでなにができるか?」という課題に際しても、ではどんな課題があって、それにはどんなデータが必要で、そのデータがあるか/ないか、と考えればよいです。課題がないデータ分析からは何も生まれません。

なお、③トイレの混雑解消にはデータらしいデータが出てきませんが、これも立派な「データ分析」です。明示的なデータを取り扱わなければデータ分析ではない、というわけでは全然なくて、本来の目的は課題の解決であり、施策を試したところ「うまくいった」、これが計測されていないけれども目で見て明らかな成果としての、体感できた「データ」になります。問題はデータの有無ではなく、課題をいかに解決するかにあります。

ということで、この三つの課題の解決は、データサイエンティストから見ても美しい結果だなと思った次第です。


この記事が気に入ったらサポートをしてみませんか?