見出し画像

マーケティング効果測定の定石、「傾向スコア」分析とは?【因果推論③】

正しく効果を測定するための方法論として、注目を集める「因果推論」。本連載では、マクロミルのデータサイエンスチームが、その考え方とマーケティングへの応用を解説します。前回は、効果測定にバイアスが生じてしまうケースにおいて、正しい効果を得るための2種類のアプローチを紹介しました。

今回は、2つのうち、同質化させたい属性や要因が、個票データとして入手できる場合のアプローチ、「共変量をバランスさせる手法」について解説し、マーケティングで応用する際のポイントもあわせてご紹介します。

「共変量」の調整によってバイアスを除去する

早速ですが、前回の内容を振り返ってみましょう。
スマホゲームアプリの運営会社が、Web広告を出稿し、その効果を、広告接触者(処置群)と広告非接触者(対照群)のアプリの利用時間を比較することで測定しようと考えています。しかし、観察データを扱う場合、「スマートフォンの利用時間」という交絡因子が存在すると考えられるため、単純に比較してしまうと、正しく効果を測定できない可能性があります。

このような状況下では、「スマートフォンの利用時間」を同質化させたうえで、比較を行うことが必要です。同質化したい属性や要因が「共変量」として入手できる場合には、その情報を使って調整を行うことが可能です。すなわち、分析対象者の「スマートフォンの利用時間」がデータとして取得できていれば、バイアスを除き、正しい効果測定ができる可能性がある、といえます。

共変量をバランスさせる2つの調整法

こうした「共変量」を用いた調整法のうち、正確に同質化(バランス)させることができるとされているものは2つあります。

1つ目は「マッチング分析」と呼ばれる方法です。この方法では、処置群に属するそれぞれの人に、共変量の値が同じ人、あるいは近い人を、対照群の中から選ぶという「マッチング」の操作を行います。

先ほどのゲームアプリの例であれば、以下の図1のように、「スマートフォンの利用時間」が同じ広告接触者と広告非接触者をマッチングさせ、その後、広告接触者の平均アプリ利用時間と、マッチングした広告非接触者の平均アプリ利用時間の差を計算することで効果を算出します。スマホ利用時間の値が同じ、あるいは近い人を比較対象とするので、算出された結果の違いは広告に起因したものと考えられます。

図1:マッチング分析のイメージ

2つ目は「重み付け分析」です。この分析では、対照群の一人ひとりに「重み(weight)」を定義します。この重みは、共変量の値を基にした、「その個人を何人分(何倍)として扱うか」という数字です。対照群の結果は、単純な平均ではなく重みを考慮した「重み付き」平均を計算し、それを処置群の平均と比較することで、共変量の違いを除いた効果を算出します。どのように計算するかは、以下の図2を参照して考えるとイメージしやすくなります。

図2:重みの計算方法の例

例えば、図2の広告非接触群のcさんのスマホ利用時間が150時間であり、利用時間が同程度の人数が、広告接触群では5人、広告非接触群では2人だったとします。つまりcさんは、スマホ利用時間という観点では、広告非接触群では稀なタイプで、広告接触群に似た人が多いことがわかります。「重み付け分析」では、cさんを5/2 = 2.5人分として扱い、広告非接触群全体に占めるcさんの影響力を高めます。また、dさんのスマホ利用時間が50時間であり、同程度の利用時間の人数が、広告接触群では1人、広告非接触群では5人であった場合、dさんには1/5 = 0.2人分として、逆に広告非接触群全体に与える影響力を下げます。

このような処理を行うことで、仮想的に、広告接触群に近い属性の人を「増やし」、逆にあまりいない属性の人を「減らす」ことができます。そのため、以下の図3のように、非接触群の属性構成を接触群に近づけたうえでの比較が可能になります。

図3:重み付け分析のイメージ

「傾向スコア」分析で複数の交絡因子に対処する

ここまで、2つの調整法を紹介してきました。説明を簡単にするために、ここまでは同質化させたい共変量が「スマートフォンの利用時間」の1つだけであると考えてきましたが、実際のマーケティング施策の効果測定においては、交絡因子が複数存在すると考えられます。

先ほどの例でも、仮にWeb広告が、性別でターゲティングされているような場合には、広告接触者と広告非接触者で性別の構成比が一致しません。また、男女でゲームの利用時間が異なるとも考えられるため、この場合、スマホ利用時間だけでなく、性別も交絡因子となる可能性があります。

このようなときに同質化を行うには、広告接触者と広告非接触者の中に、スマホ利用時間が同じ、かつ性別が同じ人が必要です。しかし、「複数の共変量がすべて同じ」人は、稀にしか存在せず、取得できているデータの中には存在しない可能性もあります。

こうしたケースでは、複数の共変量を別々に扱うのではなく、まず共変量を1つの指標にまとめるという操作を行い、共変量の代わりにその指標を用いて分析します。指標の作成には「ロジスティック回帰」と呼ばれる分析手法を用います。これは、複数の共変量(先ほどの例であればスマホ利用時間と性別)から、処置群(広告接触者)に入るか、対照群(広告非接触者)に入るかを予測する分析です。その予測モデルを全ての分析対象者に当てはめることで、それぞれの分析対象者が、「処置群になる確率」を計算することができます。この確率は「傾向スコア」と呼ばれ、この値を用いて前述した2つの分析を行うことになります。

この「傾向スコア」は特に、2つ目の「重み付け分析」と相性が良い指標と言えます。指標自体が「処置群になる確率」であるため、同じような値を取る人の人数を処置群と対照群で計算し直す必要がなく、このスコアを少し変形するだけで、「重み」として利用できるためです。つまり、ある対照群に属する人の傾向スコアが「0.6」であれば、同じ共変量の値が100人いた場合、60人は処置群、40人は対照群に入るという解釈ができるため、0.6/0.4 = 1.5の重みを与えればよい、ということになります。傾向スコアを用いることで、多くの属性や要因を、処置群と対照群で同質化させることが可能となり、効果測定の正確性は大いに高まるといえるでしょう。

2つの交絡因子に注意して広告効果を測る

「共変量」を用いた調整は、広告効果測定の中でも、特に広告が消費者の態度をどの程度変容させたかを評価する「ブランドリフト調査」と親和性があります。ブランドリフト調査では、広告接触者と広告非接触者を特定し、アンケート調査によって、両者のブランドや商材の認知、好意、購入意向を比較することで消費行動に与える広告効果を明らかにします。

そして、ブランドリフト調査でも交絡因子の存在に注意を払う必要があります。接触者と非接触者が、ランダム化比較試験(RCT)のようにランダムに割り振られていない場合、認知や好意、購入意向などに影響を与える属性や要因が同質になっていないと考えられます。ブランドリフト調査において、こうした交絡因子となりうる属性や要因は、主に以下の2つがあると考えられます。

1つ目は、当該の商品カテゴリの利用・購入頻度、または興味関心といった、その商品カテゴリへの「関与度」です。
例えばWeb広告であれば、Web上の行動履歴によってレスポンスの高そうな消費者へのターゲティングが可能です。ターゲティングによって、同じ商品カテゴリの購入経験のある消費者や、興味関心の高い消費者に広告を届けやすくできます。その一方で、こうした消費者は、広告に接触していなくてもブランドに対する認知や好意、購入意向が高いとも考えられ、「関与度」は交絡因子となり得ます。

2つ目は、出稿先メディアの「利用頻度」です。
例えば、動画メディアに広告を出稿する場合、その動画メディアをよく利用する人は、広告に接触する確率が高くなります。加えて、普段からその動画メディアを通して様々な情報を得ていた場合、特定のブランドを認知する機会を高めている可能性があります。

このような交絡因子がある状況で広告接触者と広告非接触者の認知度、好意度、購入意向などを比較しても、関与度やメディア利用頻度の違いによる影響なのか、広告による影響なのかを区別できず、正しい効果測定が行えません。つまり、広告効果を過大に評価してしまうリスクがあるといえます。

しかし、ブランドリフト調査は「アンケート調査」であるため、こうした交絡因子となりうる意識要因や行動要因を聴取し、データとして入手することができます。つまり、認知や好意などの態度変容指標と同時に、カテゴリ関与度やメディア利用頻度を取得し、傾向スコアによる調整を行うことで、より確かな効果測定が可能になります。交絡因子の存在に注意を払い、広告を正しく評価することで、マーケティングアクションの精度向上が期待できるでしょう。

今回は、同質化させたい属性や要因が「共変量」として分析に用いることができる場合の調整方法と、マーケティングにおける活用例を説明しました。今回の内容を整理します。

●共変量をバランスさせる調整手法には、「マッチング分析」や「重み付け分析」がある。

●同質化させたい共変量が複数ある場合は、複数の共変量を1つにする「傾向スコア」を用いて分析を行う。

●ブランドリフト調査では、カテゴリ関与度やメディアの利用頻度が交絡因子となり得るため、正しい測定を行うために、傾向スコアによる調整が有用である。

第4回となる次回は、同質化させたい属性や要因が、個票データとして入手できない場合のアプローチ「施策の前後で比較する手法」について解説を行います。

<因果推論に関する記事一覧>
マーケターの新常識、正しい効果測定の技術とは 【因果推論①】

効果測定に潜むバイアスを除く2つのアプローチ 【因果推論②】

行動データを活用した効果測定の最適解、「差分の差分法」 とは?【因果推論④】

この記事が参加している募集

マーケティングの仕事

みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!