見出し画像

The book of why "「行動すること」を「見ること」に変える3つのルール"からfront-door formulaの導出を追う

因果推論の数式の意味を理解するのに骨が折れるため数式を追う。
書籍ではどのルールを用いたかのみ記載されているが、その意味を自分の言葉で書き下したことで少しfront-door formulaと仲良くなれたと思う。

公理1. 変数Wが変数Yと無関係であることを観察した場合、Yの確率分布には変化が起きない。例)火→煙→報知器で、煙の状態がわかれば火と報知器は無関係

 公理2. 変数ZがXからYへのすべてのバックドア経路をブロックするならば、Zを条件に、do(X)はsee(X)と同じになる。(交絡解消のための調整を行ったあとにみられる相関関係は、真の因果関係とみなせる。)

公理3. XからYに至る因果効果が存在しない場合には、下記の変形が可能になる。(XがなんであってもYに影響を与えないため)

The book of why, 「因果推論の科学 『なぜ?』の問いにどう答えるか」

それぞれ数式で
公理1.

$$
P(Y|do(X), Z, W) = P(Y|do(X), Z)
$$

公理2. 

$$
P(Y|do(X), Z) = P(Y|X, Z)
$$

公理3.

$$
P(Y|do(X))= P(Y)
$$

と表せる。
これらの公理をもとにフロントドア基準の式の導出が記載されている。

s(smoke) → t(tar) →c(cancer)の関係において、sとcの間にunmeasured confounderがあったとしても、フロントドア基準の公式を用いればs→cの因果効果を推定することができる。

$$
P(c|do(s))\\
= \sum _t P(c|do(s), t)P(t|do(s))\\
=\sum _t P(c|do(s), do(t)) P(t|do(s))\;タールと癌の関係で喫煙で調整するとバックドアはブロックされるため\\ 
=\sum _t P(c|do(s), do(t)) P(t|s)\; 喫煙とタールの関係で全てのバックドアはブロック\;do(s)とsee(s)が同一になる\\
=\sum _t P(c|do(t)) P(t|s) \;喫煙から癌に向かう直接因果効果がないため do(s)を消去できる\\
=\sum_{s'}\sum_t P(c|do(t), s') P(s'| do(t)) P(t|s) \; 喫煙の状態s'ごとに計算して足し合わせる\\
=\sum_{s'}\sum_t P(c|t, s') P(s'|do(t)) P(t|s) タールと癌の関係で喫煙で調整するとバックドアはブロックされる\\
=\sum_{s'}\sum_t P(c|t, s') P(s') P(t|s) \; 喫煙する確率はタールの状態に依存しないのでdo(t)を消去できる
$$


フロントドア基準の数式を理解するために必要だったこと

・バックドア基準の公式 (公理2)を含めた3つの公理の理解
・s→tの関係において, cがunmeasured confounderを通る経路の
colliderになっており P(t|do(s))=P(t|s)であること
・t→cの関係において, sを調整することでunmeasured confounderを通るバックドア経路がブロックされること P(c|do(t), s)=P(c|t, s) 

#front-door-criteria
#疫学

この記事が気に入ったらサポートをしてみませんか?