The book of why "「行動すること」を「見ること」に変える3つのルール"からfront-door formulaの導出を追う
因果推論の数式の意味を理解するのに骨が折れるため数式を追う。
書籍ではどのルールを用いたかのみ記載されているが、その意味を自分の言葉で書き下したことで少しfront-door formulaと仲良くなれたと思う。
それぞれ数式で
公理1.
$$
P(Y|do(X), Z, W) = P(Y|do(X), Z)
$$
公理2.
$$
P(Y|do(X), Z) = P(Y|X, Z)
$$
公理3.
$$
P(Y|do(X))= P(Y)
$$
と表せる。
これらの公理をもとにフロントドア基準の式の導出が記載されている。
s(smoke) → t(tar) →c(cancer)の関係において、sとcの間にunmeasured confounderがあったとしても、フロントドア基準の公式を用いればs→cの因果効果を推定することができる。
$$
P(c|do(s))\\
= \sum _t P(c|do(s), t)P(t|do(s))\\
=\sum _t P(c|do(s), do(t)) P(t|do(s))\;タールと癌の関係で喫煙で調整するとバックドアはブロックされるため\\
=\sum _t P(c|do(s), do(t)) P(t|s)\; 喫煙とタールの関係で全てのバックドアはブロック\;do(s)とsee(s)が同一になる\\
=\sum _t P(c|do(t)) P(t|s) \;喫煙から癌に向かう直接因果効果がないため do(s)を消去できる\\
=\sum_{s'}\sum_t P(c|do(t), s') P(s'| do(t)) P(t|s) \; 喫煙の状態s'ごとに計算して足し合わせる\\
=\sum_{s'}\sum_t P(c|t, s') P(s'|do(t)) P(t|s) タールと癌の関係で喫煙で調整するとバックドアはブロックされる\\
=\sum_{s'}\sum_t P(c|t, s') P(s') P(t|s) \; 喫煙する確率はタールの状態に依存しないのでdo(t)を消去できる
$$
フロントドア基準の数式を理解するために必要だったこと
・バックドア基準の公式 (公理2)を含めた3つの公理の理解
・s→tの関係において, cがunmeasured confounderを通る経路の
colliderになっており P(t|do(s))=P(t|s)であること
・t→cの関係において, sを調整することでunmeasured confounderを通るバックドア経路がブロックされること P(c|do(t), s)=P(c|t, s)
#front-door-criteria
#疫学
この記事が気に入ったらサポートをしてみませんか?