見出し画像

統計学が最強の学問である ビジネス編⑤:バリューチェーン別での統計学(+人間個人の寿命を"予測"する難しさ)

読書ノート(150日目✨)
さて、本日も昨日に続き
「統計学が最強~」シリーズ3冊目、
「ビジネス編」です。

この本は、
統計学をビジネスに活用するには?
を目的に書かれた本です。

本書の中では
・経営戦略のための統計学
・人事のための統計学
・マーケティングのための統計学
・オペレーションのための統計学

と、4つのビジネス領域に対して
統計学をどう活用できるかが
解説されています。

その中でも今日は
・オペレーションのための統計学
について紹介していきます。

・第4章:オペレーションのための統計学
・バリューチェーンから見るオペレーションの改善テーマ案
 
※文字で紹介するよりも、本書の図の方が
  断然分かりやすかったので、以下をご参照ください

オペレーション改善の
分析テーマを検討するにあたり、
本書ではバリューチェーン
整理を以下のようにしています。

そして改善テーマが決まれば
該当の部署と連携して
以下のデータを収集し、
アウトカムと解析単位を決めていく。

そして今まで、人事やマーケティングの
ための統計学の手順で紹介した通り、
重回帰分析やロジスティック回帰で
関係性を見つけ、最後は
ランダム化比較実験によって
効果検証をして因果関係を解明する。
といった、本書シリーズでお馴染みの
「分析の基本の型」が示されていました。

この他にも、この章の中で
印象に残った事がいくつかあったので、
自分の備忘メモとして残しておきます。

・業務のためのデータから分析のためのデータへ
・まずは今あるデータの分析から始める

・アウトカムと解析単位が決まれば、あとは説明変数を決めればよい
・ただし、説明変数を考えることは「仮説を考える」のとは異なる
・本来良い仮説とは、直感に反したり、意外性をもつものだが、
 それを考え出すことはそもそも難しい
・それより、仮置きでもよいので解析単位を決め、
 その特徴を今あるデータから定義をするというアイデア出し
 片っ端からした方がよく、それこそが説明変数を考えることに繋がる

・その際、いきなり何かの調査をしようとか、
 データを集める仕組みを作ろうとしたくなる手を一度止め、
 それよりも、とりあえず今あるデータだけで
 何が分かって何が分からないのか実際に分析して考えてみた方が良い
・一元化されたデータベースで、いつどのような分析の要望がきたとしても
 対応できるような基盤を作ろうというのは素晴らしいアイデアだが、
 これにはとんでもない手間がかかることが多い
・そのため「最初から全てのデータを完全にしよう」とは考えず、
 「とにかくできる範囲でよいから分析してみる」というやり方がおすすめ

・「洞察のための分析」と「予測のための分析」
「洞察のための分析」は「どうすれば売上が上がるか」を知りたい場合、
 「予測のための分析」は「売上を正確に予測したい」場合で、
 売れる個数が分かれば、必要なだけ仕入れや製造をして、
 適正在庫を抱えるといったキャッシュフローの最適化ができる
・「予測のための分析」の場合は、機械学習などの高度な分析手法を使い
 予測性能を大きく向上されられる一方で、
 このような分析はブラックボックス化していく
・こうした手法はブラックボックスでもよいからとにかく当てることが目的
 なので、「どの説明変数がどれだけアウトカムと関係しているか」
 という「洞察」は分かりにくくてもよく、説明変数を複雑に変換し、
 とにかく予測値と実際の値の間にズレが小さくなるようにすることで、
 しばしば高い予測性能を発揮することができる
・ただしビジネスで重要なのは「どれだけの精度で当たるか」だけでなく、
「外れた場合にどのような問題・リスクが生じるのか」という観点もある
・機会損失を重視すべきか、それともリソースの無駄を警戒すべきかなど、
 どれだけのバッファを持って予測結果に従うべきかを考慮することで
 オペレーションの改善に大きな価値を生み出すはず

・「予測のための分析」の難しさ
・ある人間がその後何年生きるのかを正確に予測することは困難である
・たとえば、80~94歳という高齢で、全身に転移が見られる
 末期の肺がん患者はあと何年生きるだろうか?
・基本的には「1年以内には亡くなるでしょう」と考えるのが妥当だが、
 全国がんセンター協議会のデータからは、このような患者の80%ほどは
 1年以内に亡くなると考えられる
・逆に考えれば、1~2年生きられる人も10%弱ほどは存在しており、
 わずか数%だが5年以上生きる者もいないわけではない
・高齢の末期がん患者でさえそうなのだから、
 多少不健康な40代男性などの予測はさらに難しい
・個別を「予測」することは、人体は複雑で1人1人の体質は大きく異なり、
 それゆえに同じ年齢で同じがんになっていても長生きできる人と
 そうでない人がいるので予測は困難である
・一方、薬の効果検証などの「洞察」を行う場合は、
 あくまで集団レベルでの因果関係を見る点で異なる
・個人レベルでは薬の効果が全くない人もいるかもしれないが、
 この薬を飲んだグループの方がランダム化比較実験によって、
 偶然のバラツキや誤差の範囲を超えて、明らかに集団としての
 寿命が長くなったとすれば、この薬は今後使うべきだと実証できる

「予測」と「洞察」では
そもそも達成したい目的が違うため
分析に使う手法が全然違うことや、
個人を予測することの難しさを、
どう説明したら分かりやすいだろうか
…と、最近モヤモヤと考えていたなか、
この本を読んでスッキリしたので
長文でしたがメモとして残しつつ、
noteでもシェアをしてみました。

さて、「統計学が最強~」シリーズを
オリジナル版、実践編、ビジネス編と
3冊を年末年始休暇で一気読みしたことで、
著者である西内先生の「分析の基本の型」
整理しながら理解することができ、
自分にとっては凄く有意義な2024年の
スタートにすることができました!✨

過去のnoteの再掲にはなりますが
「統計学が最強~」シリーズでの
分析の基本手順は以下の通りで、
本書では何度も、この手順+α
紹介がされていました。

・ビジネスで統計学を用いる場合の分析の手順 
手順①:重回帰分析/ロジスティック回帰で関連性を分析
手順②:結果の解釈
手順③:必要に応じて因子分析/クラスター分析で縮約
手順④:t検定やz検定でA/Bテスト(ランダム化比較実験)を検証

「統計学が最強の学問である 実践編」より

また、本書シリーズで登場する
分析手法の一覧表はこちらです。

「統計学が最強の学問である 実践編」 P242
「一般化線形モデルの整理」より


シリーズ最後の1冊である数学編
まだ読み切れていないのと、
noteで紹介しきるには
私の理解力&説明力不足のため…
自分だけの今年の課題図書として
電車の通勤時間などを使って
マイペースに読み進める予定です。

次回からは「2024年の将来予測」
を新たなテーマとして、
以下の2冊を今は読み進めています。

ということで、次回以降は
統計学から少し離れて
ビジネス寄りの読書ノートを
更新していくつもりです。

本日もここまで読んでくださった皆さん、
どうもありがとうございました!😊

それではまたー!😉✨

この記事が参加している募集

最近の学び

仕事について話そう

この記事が気に入ったらサポートをしてみませんか?