見出し画像

データ分析コトハジメ(全1回w) 「異常値こそ金」

唐突やけど、ちょっと思うところがあって書くわ。

あのな、よくデータ分析とかするやんか。研究の類いかもしれへんし、会社の仕事や趣味の何かかもしれへん。

まあ、目的は様々やろうけど、ことビジネスに関してゆうと、
「データ分析して、新しい行動につながるような示唆を得たい」
ちゅう目的が多いんちゃうか。

で、そんときによく見かけるのが、相関分析や。凡百の分析家は、XとYの2つを比べて、棒線引っ張って


「XとYは、相関してます」

とか、ドヤる訳やな。

XとYはなんでもええわ。「設備投資額と利益額」でも、「勉強時間と偏差値」でも、「イケメン度とバレンタインデーにもらうチョコの数」でも。

でもな、たとえばやで
「勉強時間と偏差値は相関しています」
「偏差値を上げたかったら、たくさん勉強してください」

って、データ見せられながら、ドヤ顔でゆわれたら、どうや?

「知っとるがなー!!!!」

て、なるやんww

だいたい相関分析ちゅうか傾向分析って、そうなるやろ。「細かい相関の程度はわからへんけども、まあ、そうゆうことにはなるやろな」みたいな。
「モマエみたいなド素人三流コンサルは知らんかったかも知れへんけど、うちのベテラン社員からしたら常識やで!」ってゆうようなこと。

科学的な研究しとるわけやない。ビジネスの世界の分析は、要するに、それが「新しい」行動に繋がらなアカンし、逆にゆうたら繋げられれば十分や。

もちろん、なんや、ビジネスのシーンかて、その「細かい相関の程度」みたいなもんに意味があることもあるんやけどな。

でやな、こっからやで。今日の本題。教えとくわ。むっちゃ上から目線やけど、ここ大事やから、もうはっきりゆうとくわ。

あのな、相関分析したら、見つけなアカンのは異常値やで!!!コレやコレ!!!

「異常値こそ、金!!!!!傾向なんて、誰でも知っとるわ!!!」

異常値あるとR2がよう出んくなるから「ノイズや、ノイズや」ゆうて、ついつい異常値とか無視したくなってまうやろ。けどな、ちゃうねん。見なアカンのは、引っ張った棒線が示す「傾向」やなくて、異常値の方やねん。

その異常値出した事例(「標本」ってゆうの?モマエらはw)を個別に見ていくことに分析のキモがあるんやで!

「みんなはたくさん勉強すればするほど偏差値が上がってるのに(傾向)、一人だけみんなの半分の勉強時間で偏差値がやたらと上がっとるやつがおる!(異常値)」
ってなったら、
「そいつ、何やっとるんやろ?」
ってなるやんか。
知りたいのそうゆうことやろ。逆もそうや。

「イケメン度が高いほど、たくさんチョコ貰えるはずなのに(傾向)、一人だけ、同じイケメン度のやつの半分もチョコもらえへんやつがおる!(異常値)」

みたいなの、「なんで?なんで?」
ってなるやん。

これを確認しに行って、「どうしてるのか」を調べる。それがデータ分析やで。

って、むっちゃ雑な話やけど、ワイ、どうしても言いたかった。しかも今日wwww

相関係数見せるだけでもええけど、そんなら、せめて「未知だった相関(傾向)」や、「相関(傾向)があると思ってたのに、実は相関(傾向)がなかった」みたいな驚く結果を持って来るんやで。「誰でも知っとる傾向をデータで改めて示す」だけで金取れると思ったら、大間違いやで、キミwwww

今日は、ここまでやーーーーーーッッッッ!wwww

追記:
ちな、タイトル画像は、ワイの長年の経験から導いた「猫の画像を貼るとアクセス数が多くなる」ちゅう傾向に基づいて選択しとるで。データは取ったことないけどwww

この記事が気に入ったらサポートをしてみませんか?