見出し画像

Mendelian Randomization 勉強日記 12. 複数の遺伝子領域のバリアントを用いた頑健な手法

mendelian randomization
methods for causal inference using genetic variants chapter 7. の勉強まとめ

*バリアントと曝露、アウトカムの関係はhomogeneous (個人によって変わらない)であり、線形であると仮定する。


Consensus methods

Median method

IVW法は重みづけした平均を考慮しているのに対して、推定値の中央値をとる方法。中央値に重みづけすることもできる(Weighted-median)。
バリアントの50%以上が妥当でないといけない ('majority valid' assumption)。

Mode-based estimation method

バリアントの数が増えたとき、約半分はaという推定値に近く、もう半分はbという推定値に近かったとする。どちらが妥当な操作変数の推定値で、どちらが妥当でない操作変数の推定値なのか判別することは難しい。
しかし、例えば40%がaに近く、10%がbに近く、15%がcに近い、などのとき、どれが正しい推定値かはわからないが、40%のバリアントが推定したaという推定値が妥当な操作変数による推定値に近いだろうと考えることができる。('pleurality valid' assumption, Zero Modal Pleiotropy Assumption[ZEMPA]) このように頻度が高い推定値に重みを付ける手法がMode-based estimation methodである。

これらのConsensus methodsはoutlierの影響を受けにくい。しかしまだ妥当でない操作変数の影響を受けやすい。また効率性も落ちてしまう(特にMode-based estimation method)。

Outlier-robust methods

MR-PRESSO method

MR-Pleiotropy Residual Sum and Outlier (MR-PRESSO) method

【概要】まずすべてのバリアントを用いてIVW法を行い、回帰式から残差の合計の平方 (Residual Sum of Squares; RSS)を計算する。RSSは異質性の指標であり、Cochran's Q statisticに等しい。次に、バリアントをそれぞれ順番に除外してIVW法を行う。もしシミュレーションした分布よりRSSが大きく減った場合、そのバリアントを解析から除外する。除外するバリアントがなくなるまで手順を繰り返す。残ったバリアントで因果効果を推定する。

【特徴】少数の大きく外れ値をとるOutlierのバリアント (=pleiotropyが強いバリアント)があるときに特に有効である。中等度のpleiotropyがあるバリアントが多数ある場合はあまり有効ではない。

MR-Robust method

IVW法のように重みづけ線形回帰を行うが、Tukeyの損失関数を加えたMM-estimationを行うことでOutlierの影響を少なくする。

MR-Lasso method

MR-Lassoでは、IVW回帰モデルは、各遺伝的バリアントに対する切片項を追加する。IVW推定値は、下式を最小にする$${\theta}$$である。

$$
\sum_{j=1} ^J se(\hat\beta_{Yj})^{-2} (\hat\beta_{Yj}-\theta\hat\beta_{Xj})^2
$$

MR-lassoでは、下式を最小にする。

$$
\sum_{j=1}^J se(\hat\beta_{Yj})^{-2} (\hat\beta_{Yj} - \theta_{0j} -\theta\hat\beta_{Xj})^2  +\lambda \sum_{j=1}^J |\theta_{0j}|
$$

$${\lambda}$$はtuning parameterである。切片項 $${\theta_{0j}}$$はj番目のバリアントがアウトカムに与えるpleiotropic effectを表す。$${\lambda}$$が∞のとき、$${\theta_{0j}}$$はゼロになるので、すべてのバリアントが妥当であるという仮定となり、IVW法と一致する。$${\lambda}$$が0のとき、すべてのバリアントはpleiotropicであり、推定値が決められない。段階的に$${\lambda}$$を増やしていくと、より多くのpleiotropyパラメータがゼロに等しくなることを意味する。つまり対応するバリアントが解析に含まれることを意味する。解析に含まれるバリアントの比率推定値に、偶然だけで予想されるよりも多くの異質性がある一歩手前まで、段階的にλを増加させる。

summary of outlier-robust method

MR-PRESSO, MR-Lasso methodはバリアントを解析から除外するのに対して、MR-Robustは重みを減らす。少数なバリアントがheterogeneous ratio estimatesをとるときに真価を発揮する。注意点として、これらの手法で多くのバリアントが除外された時、残ったバリアントでの推定の信頼性が高く見えても強いエビデンスがあるとは言えない。

Modelling methods

Decomposition of genetic associations and the IVW method

ここで多面的作用 (pleiotropic effect)を$${\alpha_j}$$と仮定して、下記の式を考える。

$$
\beta_{Y_j} = \alpha_j + \theta \beta_{X_j}
$$

*estimateではなくparameterとして記載しているので^の記載がない
ratio estimandは

$$
\frac {\beta_{Y_j}} {\beta_{X_j}} = \frac {\alpha_j + \theta \beta_{X_j}}{\beta_{X_j}} = \theta + \frac {\alpha_j} {\beta_{X_j}}
$$

causal effect $${\theta}$$と一致するのは、$${\alpha_j=0}$$すなわちpleiotropyがないときに限られる。このため、pleiotropyがあるときはIVW法はbiasを生じる。しかし、pleiotropic effectの重みづけ平均がゼロで$${\alpha_j}$$と$${\beta_{X_j}}$$の重みづけ相関がゼロのときもcausal effect $${\theta}$$に近似できる。この条件を'balanced pleiotropy'と呼ぶ。
$${\alpha_j}$$と$${\beta_{X_j}}$$の重みづけ相関がゼロという条件のことを'InSIDE asuumption'と呼ぶ (Instrument Strength Independent of Direct Effect)

MR-Egger method

MR-Egger法はIVW法と似ているが、回帰モデルに切片項$${\theta_0}$$を含むという違いがある。

$$
\hat\beta_{Yj} = \theta_0 +\theta\hat\beta_{Xj} + \epsilon_j, \: \epsilon_j ~N\big(0, se(\hat\beta_{Yj})^2\big)
$$

傾き$${\theta}$$がMR-Eggerの推定値である。

MR-Lasso法との違いは切片項$${\theta_0}$$を1つのみ含む=平均的なpleiotropic effectを考慮している、ということである。

MR-Egger法はInSIDE仮定のもとで一貫した推定値を与える。
IVW法と異なり、平均的なpleiotropic effectがゼロでなくてもよい(切片項$${\theta_0}$$として考慮されている)。
平均的なpleiotropic effectがゼロでないことを'directional pleiotropy'と呼ぶ。

MR-Egger法の切片は操作変数法の仮定を検証することにもなる。切片項がゼロでないことはdirectional pleiotropyの存在またはInSIDE仮定の違反を示唆する。

MR-Egger法は直感的にはバリアントと曝露、バリアントとアウトカムの間にdose-response relationshipがあるかどうかを評価している。

教科書の図の左側においてバリアントは5つあり、それぞれは要因とアウトカムが正の関係にあるが、要因が大きくなってもアウトカムが増えるという用量反応関係がない。MR-Egger法を用いると破線の直線が引けて切片はゼロではなく、'directional pleiotropy'が示唆される。右側も直線がIVW法の推定で正の関係がみられるが、MR-Egger法は破線で関係はnullである、という例である。



MR-Egger法の困難

①effect alleleとreference alleleを逆にすると推定が変わるので、最初に遺伝的バリアントと曝露の関連がすべて正であるように統一する必要がある。しかし、このことは方向性によってpleiotropic effectが変わり、InSIDE仮定の中身も変わることを意味している。これは多面的作用がゼロでなければ本来実現しえない。
②MR-Egger法の正確さはIVW法のようにバリアントが説明する曝露の分散ではなく、バリアント-曝露の関連の分散に依存するため、これらの関連が類似していた場合、MR-Egger法の信頼区間は広くなる。
③MR-Egger法では個々のバリアントに強く影響される。(outlier一つあると傾きが一気に負になることも)IVW法では影響はここまで強くない。
④InSIDE仮定はバリアントがpleiotropicの時は成り立たないことが多い。

Contamination mixture method

遺伝的バリアントの一部のみが妥当な操作変数であると仮定し、複数が有効であるという仮定の下で一貫性のある推定値を与える。この方法を実行するために、比推定値から尤度関数が構築される。
バリアントが妥当な操作変数である場合、推定値$${\hat\theta_j}$$ は、分散$${se(\hat\theta_j)^2}$$で真の因果効果θについて正規分布すると仮定される。
バリアントが妥当な操作変数でない場合、推定値は分散$${\phi^2}$$ + $${se(\hat\theta_j)^2}$$でゼロについて正規分布すると仮定される。$${\phi^2}$$は妥当でない操作変数のestimandの分散を表す。このパラメータは分析者が指定する。そして、因果効果θの異なる値、妥当な操作変数と妥当でない操作変数構成を変えて尤度を最大化する。最大化は、まずθの関数としてプロファイル尤度を構成し、次にθに関してこの関数を最大化することによって実行される。プロファイル尤度を最大化するθの値が、因果推定値となる。信頼区間は、尤度関数を用いて構築され、ブートストラップやパラメータ推定値の正規性には依存しない。信頼区間は通、対称ではなく、1つの値の範囲であることさえ保証されない。

MR-Mix method

MR-Mix methodはcontamination mixture methodと似ているが、操作変数を妥当か妥当でないかでわける代わりに、4つのカテゴリーに分ける。
1) 曝露に直接影響するバリアント (妥当な操作変数)
2) 暴露とアウトカムに影響するバリアント
3) アウトカムのみに影響するバリアント
4) 曝露にもアウトカムにも影響しないバリアント

MR-RAPS method

MR-Robust Adjusted Profile Score (RAPS)はランダム効果分布を用いて遺伝的バリアントのpleiotropic effectをモデル化する。pleiotropic effectは未知の分散でゼロについて正規分布とすると仮定する。推定値は、因果効果とpleiotropic effectの分散に対するプロファイル尤度関数を用いて得られる。outlierに対する頑健性を高めるために、Tukeyのbiweight損失関数またはHuberの損失関数が使用できる。

summary of modelling methods

モデルの仮定が正しければ価値があるが、そもそもの仮定が間違っていれば推定も誤りを生じる。例えばMR-Egger法ではInSIDE仮定が成り立つことが前提である。MR-RAPSではpleiotropic effectが本当にゼロについて正規分布するという仮定、MR-Mixでは多くのバリアントがカテゴリーに正しく分けられることが必要である。contamination mixture methodは強い仮定を必要としないが、分散のパラメータの特定に左右されやすい。

Robust methodは一長一短があり、どれが最適というものはない。複数の異なる仮定を前提とする感度解析を組み合わせることを推奨する。


感想
Mendelian randomizationに限らず臨床論文の手法の高度化が進み統計解析の項目で挫折してしまうことが多いけれど、教科書では各手法について簡潔に数式やモデル自体がわからなくても何をしているかをわかるように説明してくれているおかげで手法自体に惑わされずに本質的に何をしているかに集中して吟味することができそうだ。

特にIVW法とMR-Egger法が頻出のようなのでまずその2つの手法を抑えたいと思う。InSIDE仮定という言葉は難しいが数式にすると意味合いが理解しやすい。

この記事が気に入ったらサポートをしてみませんか?