見出し画像

効果検証入門〜正しい比較のための因果推論/計量経済学の基礎

著者:安井翔太

内容要約

#バイアスを考慮した正しい効果検証(因果推論)

本書では、バイアスを考慮した正しい効果検証をする方法について解説しています。
ビジネスにおいて、広告や説明会など何らかの施策を打った際に、本当にそれが効果的だったのかを見極めることはとても重要です。
しかし世の中には、効果が出ていないにも関わらず、ぱっと見効果抜群に見えてしまうデータが多く存在するため、誤った施策を続けてしまう企業も少なくありません。
データにはバイアスが伴うため、効果検証が難しいからです。
例えば、広告を打ち出した対象が元々購買意欲の高い顧客だったというバイアスがある場合、広告の効果はぱっと見大きく映りますが、そもそも広告を打たずとも売上が立ったということです。
誤った効果検証をしないために、バイアスを考慮したデータ解析をする必要があります。

#介入効果を測るための回帰分析

行った施策の効果は、回帰分析を用いて測ることができます。
回帰分析は被説明変数(施策の効果を測りたい変数)と介入変数(効果を測りたい施策の有無を表す変数)と共変量(バイアスを発生させていると思われる変数)により求められます。
ここでバイアスを除くために、介入変数は被説明変数と共変量の両方と、相関関係がある必要があります。
他にも、施策を打った後に変わるような変数は含まないことや、十分な今日変量を算出することなど注意しなければなりません。

#傾向スコアを用いた分析

回帰分析はせず、傾向スコアを用いてバイアスを取り除いた効果検証法があります。
傾向スコアとは、サンプルごとの介入(打った施策)が行われる確率のことです。
試作を打ったサンプルと、そのサンプルの傾向スコアに近い数値を持つ施策を打っていないサンプルを比較することで、バイアスを除いた効果検証が可能です。
傾向スコアの数値が近いということは、つまり介入(施策)の有無以外の条件はほぼ等しいとみなされ、結果得た差分が効果だということがわかります。

#差分の差分法(DID)とCasualImpact

差分の差分(DID)とは、介入(施策を打った)グループの介入後と介入前の差分から、非介入(施策を打った)グループの介入後と介入前の差分を引くことで効果を測る方法です。
これは、例えば特定の地域に施策を打ったため、地域内で非介入グループのデータが取れない時などに有効的です。
他の地域と比較する際に、介入前後の差分をあらかじめ求めることで、バイアスを取り除けるからです。
CasualImpactとは、介入(施策を打った)グループに、仮に介入を行わなかった場合の直を予測し、介入後の効果を測る方法です。
これは、そもそも介入していないグループがなく比較対象がない(DIDができない)場合に用いられます。

#回帰不連続デザイン(RDD)

回帰不連続デザイン(RDD)とは、カットオフ値前後の直を比較し効果検証する方法です。
またカットオフとは、介入有無の閾値(施策を打つかを決定するボーダーラン)のことです

例えば、過去に1万円以上ゲームアプリに課金をした人に広告を打つと決めた場合、1万円がカットオフになります。
回帰不連続デザイン(RDD)は、介入をする条件がルールとして決められている場合などに有効的です。

学び

効果検証には常にバイアスが伴っているという前提をよく理解できました。また、バイアスがある中で様々な手法を用いることで、正しい因果関係を見出すことができるのだと知りました。
正確に効果検証をするには、より深くデータを観察する必要があるとわかりました。

感想

この本を読んで、効果検証にはそもそもバイアスが伴うということがよく理解でき、また正しく測るための様々な手法があることを知りました。
正直、数式など理解できない箇所もあったのですが、ビジネスという場面においての因果推論について書かれていたので大枠は捉えることができ、データを扱う人たちの考えが少しは身についたのではないかと感じます。
またでデータ分析をしている方達の偉大さに気づきました。
何かよくわからないけれどすごいことをしているデータの方達という印象から、より具体的に存在を捉えることができるようになりました。
様々なバイアスが絡み合う中でデータを分析しているのを想像すると私なら鼻血が出そうです。
データに強い会社とは、とても大きな武器を持った会社なのだと思いました。

この記事が参加している募集

ビジネス書が好き

仕事について話そう

この記事が気に入ったらサポートをしてみませんか?