Principles of confounder selection Tyler J VanderWeele 交絡因子の選び方の原則 ハーバード 教授 疫学 「E値」E-value 残余交絡 "Negative control" "target trial emulation"

タイトルに並べたことをお勉強したのでそれのメモ


Principles of confounder selectionTyler J VanderWeele
https://pubmed.ncbi.nlm.nih.gov/30840181/

要旨
適切な交絡因子を選択してコントロールすることは、信頼性の高い因果推論を行うために重要である。最近の理論的・方法論的な発展により、交絡因子選択の原則がいくつか明らかになってきている。すべての共変量が互いに関連する因果関係図を完全に知ることができれば、共変量のコントロールに関する決定を行うためにグラフィカルなルールを用いることができる。しかし、残念ながら、そのような完全な知識は得られないことが多い。この論文では、共変量が暴露の原因であるかどうか、また結果の原因であるかどうかについての知識が各共変量について利用可能であるという、やや厳密さを欠く仮定を置いた場合の交絡因子選択の決定についての実用的なアプローチを提唱している。因果推論の文献における最近の理論的に正当化された発展に基づいて、共変量制御の決定について次の提案がなされる:暴露、結果、またはその両方の原因である各共変量を制御し、このセットから道具変数であることがわかっている変数を除外し、暴露と結果の両方の共通の原因である未測定変数の任意の代理人を共変量として含むことである。そして、交絡因子選択の様々な原則が、さらに統計的共変量選択法に関連づけられる。


Tyler J VanderWeeleはハーバード公衆衛生大学院の教授に若くして就任した天才で、因果推論理論の世界のトップ研究者ではないでしょうか。
https://en.wikipedia.org/wiki/Tyler_VanderWeele

https://scholar.google.com/citations?user=IppH3B0AAAAJ&hl=ja


disjunctive cause criterion”
https://pubmed.ncbi.nlm.nih.gov/21627630/


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Sensitivity Analysis in Observational Research: Introducing the E-Value
Tyler J. VanderWeele, PhD and Peng Ding, PhD

Ann Intern Med. 2017 Aug 15;167(4):268-274. doi: 10.7326/M16-2607. Epub 2017 Jul 11. PMID: 28693043 DOI: 10.7326/M16-2607

https://www.acpjournals.org/doi/10.7326/m16-2607

概要
感度分析は、測定されていない、あるいは制御されていない交絡の可能性に対して、関連がどの程度頑健であるかを評価するのに有用である。本稿では、交絡の可能性がある観察研究において、因果関係のエビデンスに関連する「E値」と呼ばれる新しい指標を紹介する。E値は、測定された共変量に基づく特定の治療と結果の関連を完全に説明するために、測定されていない交絡因子が治療と結果の両方に持つ必要のある、リスク比スケールでの最小の関連の強さと定義されている。E値が大きいと、効果推定値を説明するために、かなりの未測定の交絡が必要であることを意味する。E値が小さいということは、効果推定値を説明するために、測定されない交絡がほとんど必要ないことを意味する。著者らは、因果関係の証拠を得ることを目的としたすべての観察研究において、E値を報告するか、他の感度分析を使用することを提案している。著者らは、観察された関連推定値(測定された交絡因子に対する調整後)と、ヌルに最も近い信頼区間の限界の両方についてE値を計算することを提案している。もしこれが標準的なやり方になれば、科学界が観察研究からのエビデンスを評価する能力はかなり向上し、最終的には科学が強化されることになるだろう。

要約のポイント
動機 動機:治療と結果の因果関係を評価しようとする観察研究は、測定されない交絡に左右されることがある。
理由: 感度分析は、観測された治療と結果の関係を説明するために、測定されない交絡因子がどの程度強いかを評価することができる。感度解析は、使用、提示、解釈が容易で、それ自体が強い仮定をしない手法が望ましい。
E-valueの定義 E値とは、特定の治療と結果の関連を完全に説明するために、測定された共変数を条件として、測定されていない交絡因子が治療と結果の両方に持つ必要のある、リスク比スケールでの最小の関連の強さである。
計算方法 推定値のE値、およびヌルに最も近い95%信頼区間のE値は、リスク比(表1)およびその他の指標(表2)について、簡単な方法で計算することができる。
結論 E値によって、研究者は次のようなステートメントを行うことができます。「観察されたリスク比3.9は、測定された交絡因子以上に、治療と結果の両方にそれぞれリスク比7.2倍で関連する測定されない交絡因子によって説明できるかもしれないが、より弱い交絡ではそうできない。" 治療と結果の両方にそれぞれリスク比3.0倍で関連する測定されない交絡因子によって信頼区間を移動して、ヌルを含めることができるかもしれないが、弱い交絡ではそうならない.

E-valueについては昭和大学が日本語で解説を書いてくれています。

画像4

http://showa-u-rheum.com/2022/05/4328/

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Comparative Effectiveness of BNT162b2 and mRNA-1273 Vaccines in U.S. Veterans

https://www.nejm.org/doi/full/10.1056/NEJMoa2115463

https://www.nejm.org/doi/full/10.1056/NEJMoa2115463

"We matched recipients of each vaccine in a 1:1 ratio according to their risk factors. "

この研究ではマッチングしている。最近PSMが一般的に行われているが、通常はテーブル1に示されているように、マッチした群ごとの特性を並べて差がないことを示すというのが一般的だと理解しております(しそれが限界だと思っています)

画像3


この論文ではそれに加えて、サプリメントS2/3で、2群ごとのイベント(コロナ発症、コロナ以外の死亡)の差がないことも示すことで、PSMでは保証できない「残余交絡がない」ということをできるだけ示そうとしている(Negative control)。

画像1


画像2


このロジックはなるほどと思いました。

PSM含めてどんなに高度なマッチングを行ったとしても、RCTで担保されていると仮定される、残余交絡は否定できません。その限界は受け入れたうえで、その可能性を少しでも排除しようとする姿勢は素晴らしいと感じました。コロナにより学問が進んでいる感じですね。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


"target trial emulation"

Eur J Epidemiol. 2017; 32(6): 473–475.
Published online 2017 Aug 2. doi: 10.1007/s10654-017-0293-4
PMCID: PMC5550532
PMID: 28770358
Target trial emulation: teaching epidemiology and beyond
Jeremy A. Labrecquecorresponding author and Sonja A. Swanson

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5550532/

観察疫学は、常に無作為化試験の基準で考えられている。典型的な疫学論文は、序文で過去の臨床試験に言及し(あるいは臨床試験が実行不可能な理由)、可能であれば、考察で過去の臨床試験と結果を比較する。観察研究と臨床試験の結果が一致しない場合、ほとんどの場合、前者に疑問を持つことから始めます。不思議なことに、論文の中で紛れもなく重要な部分である観察研究の方法の項では、臨床試験の方法やデザインに言及することはほとんどありません。ターゲットトライアルエミュレーションは、この問題を解決することを目的としています。

ターゲットトライアルエミュレーションとは、無作為化試験のデザイン原則を観察データの解析に適用することで、それによって解析とエミュレーションする試験を明確に関連付けるものです。その目的は、たとえ比較対象試験がまだない、あるいは実行可能でない場合でも、試験デザインの原則を適用することにより、観察疫学の質を向上させることである[1]。European Journal of Epidemiologyの本号では、García-Albénizら[2]が、観察データを用いて、より一般的に用いられる分析アプローチに加えて、試験エミュレーションを用いて、8年間の追跡調査における結腸癌スクリーニングの癌発生への効果推定を比較している。対象となる試験の適格基準、治療戦略、治療割り付け、追跡期間、アウトカム、因果関係対比、統計解析を正確に特定することで、彼らは十分に特定された対象試験をエミュレーションすることの価値を示し、一般的な解析アプローチがいかに不適切であるかを示しているのです。

実際、他の研究者も強調しているように(例えば[1-5])、標的試験(とそれに適合する正式な因果関係の枠組み)を模倣することは、研究者が不必要な偏りを特定し回避するのに役立ち、観察研究で必要となるトレードオフを明確にする方法を提供する。例えば、盲検化を再現することは通常不可能ですし、データの利用可能性を考慮し、異なる適格基準を選択することを余儀なくされることもあります。同様に、ランダム割付けをエミュレートするためにベースラインの交絡因子を十分に測定できないため、有効であっても本質的な方法で介入または適格基準を変更する代替分析戦略を検討することがある [6, 7]。利用可能な測定法や利用可能な知識に基づくと、関心のある介入は十分に定義されていない可能性があり、定義されていない対象試験を記述することで、そのトレードオフを確認することになる [4, 8]。場合によっては、理想的な臨床試験を再現できなくても、妥協点を意識しながら研究を進めることがある。また、模倣できた試験が大きすぎるトレードオフであることに気づき、質問を洗練させたり、他のデータを求めたりする場合もある。これらの結果はいずれも、疫学研究を向上させるという最終目標に対して生産的なものである。

ここでは、García-Albénizらによる貢献と、試験のアナロジーを取り入れた他の最近の出版物を振り返り、この考え方がもたらすより大きな潜在的影響について議論することにする。臨床試験のエミュレーションがどのように疫学研究を向上させるかについては、以前にも他の研究者が議論しているので[1、3、4]、我々は臨床試験のエミュレーションが疫学教育に与え得る影響と、それが刺激する可能性のあるさらなる方法論の進歩に焦点を当てることとする。

教室でのターゲットトライアル
ここ数十年の疫学的手法の重要な進歩は、統計的にも、不偏推定に必要な前提条件においても、複雑さを増していることと相俟っている。g法、準実験法、その他の因果関係推論ツールが観察研究の質を向上させたのと同様に、これらの方法を十分に理解して適切に適用するには、かなりの時間を費やす必要があります。この点、試験エミュレーションは、それを理解し適用するために必要な知識が、すでに従来の疫学カリキュラムの一部であるため、異なる。García-Albénizらは、それ自体新しい方法論を適用しているわけではなく、臨床試験のデザイン原則を、時には適切に適用されていない観察データに注意深く適用しているのである。疫学者に臨床試験のエミュレーションを教えるために、疫学入門コースはほとんど補強を必要としない。臨床試験の教育ですでに使われているような新しい語彙や数学的表記は必要ない。実際、臨床試験のエミュレーションを取り入れることで、臨床試験の教育から観察研究へと論理的に移行することができます。

トライアルエミュレーションを通じて因果関係推論の原理を教えることの良い結果の1つは、なぜ一部の分析手法が問題なのかを即座に明らかにできることである。García-Albénizらが、自分たちが行う2つの一般的だが偏ったアプローチを、自分たちが好む分析とともにどのように説明しているかを考えてみましょう。トライアル・エミュレーションの枠組みがなければ、これらの偏ったアプローチの背後にある根拠は論理的であるように見えるかもしれません。しかし、最初からトライアルエミュレーションの観点で考えることを教えられたら、それらの欠点はすぐに特定されるでしょう。例えば、各解析の累積罹患率曲線を調べると、スクリーニング試験で予想される交差曲線を再現できるのは、トライアルエミュレーション解析だけであることは明らかである [10, 11]。偏りを避けることに加えて、このフレームワークは、利用可能なデータをより効率的に使用する機会も明らかにするが、これにはより複雑な方法論が含まれるため、中級または上級コースで教えるのが最適であろう。

臨床試験のエミュレーションは、疫学カリキュラムの中で因果推論を教える際の中核となるべきものであることは明らかである。しかし、いつ、誰に対して教えるのか、どの程度強調するのか、また、臨床試験のエミュレーションが一般的になった場合、どのような悪影響があるのか、といったヒューリスティックな疑問が残ります。教育者は、臨床試験のエミュレーションが疫学コースにおける他の主要な教材を置き換える価値があるかどうかを検討する必要がある。あるいは、臨床試験のエミュレーションを含めることによって、入門クラスですでに教えられている観察疫学の基礎が合理化され、よりよく伝えられる可能性もあり、またそれらの基礎と上級クラスで教えられる統計解析がよりよく結び付けられる可能性もある。疫学者以外の人(例えば、政策立案者、他分野の医学研究者)に疫学を教える教育者も、同じ基本原理を伝えながらも、因果関係図や反実仮想表記法を教えるよりも、試験のエミュレーションの方がより容易に理解できると思われるので、学生の理解度が向上することが期待される。

教室を越えて
教育や特定の研究への応用を改善するだけでなく、試験エミュレーションの枠組みを取り入れることで、疫学者が科学的プロセスにおいてより創造的になる機会を提供することができます。(もちろん、そのような広範な方法を形式化し、評価することは重要である)。ここでは、そのような2つの例について簡単に説明する。

まず、García-Albénizらの設定を考えてみましょう。彼らは、実際のランダム化試験が進行中であるにもかかわらず、今後数年間は発表されないことを知りながら、スクリーニング大腸内視鏡検査のターゲット試験をエミュレートしています。彼らの研究や他のデータで関連するターゲットトライアルをエミュレートした研究がすべて大腸内視鏡検査の長期的有用性を同様に示しているとすれば、大腸内視鏡検査の効果に確信を得るために実際のトライアルで10年のフォローアップ時間が発生するのを必ずしも待つ必要があるのだろうか。実際の臨床試験のフォローアップ期間が短くても、観察研究で推定された短期的な因果関係が、その時点での臨床試験の結果を忠実に反映しているかどうかを確認することは可能である。もし、そのように一致するのであれば、我々の観察研究が正しい方向性を示していることになり、臨床試験の結果を待つよりもずっと早く、自信を持って大腸内視鏡検査を勧めることができるようになるかもしれません。もし、互いに密接に対応しない場合は、無作為割付をエミュレートした手段を再検討する動機になるかもしれません(例えば、どのような測定不能な交絡が残っているのか)。しかし、たとえ無作為割付のエミュレーションがうまくいったとしても、試験のエミュレーションが実際の試験との比較可能性を保証するものではないことに注意することが重要です。研究対象集団の違いや、対象となる試験のプロトコルが実際の試験と正確に一致していないその他の理由によっても、推定値が異なる可能性があります[12]。しかし、結果がいつ、なぜ一致するかを理解することで、観察研究と実際に進行中の試験の力を合わせ、よりタイムリーな結論を導き出し、試験が進むにつれてその結論を改良し続けることができる。

第二に、スタチン系薬剤の心血管系疾患および死亡に対する効果のような、稀な結果に対するある治療の効果を研究するという、かなり一般的な設定について考えてみましょう。適切なサンプル数をもって、適応となるすべての患者を対象とした試験を実施することは不可能であろう。その代わりに、治験責任者は(転帰がそれほど稀ではないと予想される)高リスク集団で試験を実施したり、コレステロール値などの代替転帰を検討したりすることができる。どちらも、政策立案者、臨床医、患者にとって最も緊急な問題に必ずしも答えてはいない。観察研究では、実施された臨床試験を模倣して、我々の推定値が臨床試験と一致しているかどうかを確認することができる。このように観察研究の結果を「検証」した上で、観察分析の対象となる試験を修正し、より不均質な集団における効果や、代替エンドポイントではなく、関心のあるエンドポイントに対する効果など、他の量を推定することができる。つまり、理想的な質問を正確に対象としていない実際の無作為化試験の結果と観察研究の力を組み合わせることで、試験や観察研究だけでは得られない、より強固な結論をサポートすることができるのです。

結論
観察研究において明示的に目標試験をエミュレートすることが、十分に実施された試験の結果とどの程度一致するかは、まだわからない。これまでの結果は有望であるが(例えば[2, 5, 13])、García-Albénizらのような、試験結果が判明する前に試験をエミュレートする研究は重要であろう。しかし、試験エミュレーションの背後にある原則は、既知の優れた実践を奨励するものであるため、関係なく採用されるべきだと考えている。

トライアルエミュレーションの直接的な利点は、ここや他の研究者によって概説されていますが[1, 3, 4]、トライアルエミュレーションの影響は、個々の研究の改善に留まらず、教室や科学プロセス全体へのアプローチの仕方にも及んでいます。García-Albénizらがtrial emulationを教える上で、素晴らしい例を示してくれたことに感謝します。大腸内視鏡検査の無作為化試験が発表されれば、結果が一致するかどうかにかかわらず、彼らの論文は教室でさらに役立つと確信しています。しかし、この論文が、将来の学生に、臨床試験のエミュレーションの価値、因果関係を推定する際の謙虚さの必要性、科学的知見の反復性、あるいは上記のすべての組み合わせについて教えることになるのかどうかは、まだわかりません。

結論
観察研究において明示的に目標試験をエミュレートすることが、十分に実施された試験の結果とどの程度一致するかは、まだわからない。これまでの結果は有望であるが(例えば[2, 5, 13])、García-Albénizらのような、試験結果が判明する前に試験をエミュレートする研究は重要であろう。しかし、試験エミュレーションの背後にある原則は、既知の優れた実践を奨励するものであるため、関係なく採用されるべきだと考えている。

トライアルエミュレーションの直接的な利点は、ここや他の研究者によって概説されていますが[1, 3, 4]、トライアルエミュレーションの影響は、個々の研究の改善に留まらず、教室や科学プロセス全体へのアプローチの仕方にも及んでいます。García-Albénizらがtrial emulationを教える上で、素晴らしい例を示してくれたことに感謝します。大腸内視鏡検査の無作為化試験が発表されれば、結果が一致するかどうかにかかわらず、彼らの論文は教室でさらに役立つと確信しています。しかし、この論文が、将来の学生に、臨床試験のエミュレーションの価値、因果関係を推定する際の謙虚さの必要性、科学的知見の反復性、あるいは上記のすべての組み合わせについて教えることになるのかどうかは、まだわかりません。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


Research Fast Facts
Target trial emulation: applying principles of randomised trials to observational studies
BMJ 2022; 378 doi: https://doi.org/10.1136/bmj-2022-071108 (Published 30 August 2022)
Cite this as: BMJ 2022;378:e071108

https://www.bmj.com/content/378/bmj-2022-071108

https://www.bmj.com/content/378/bmj-2022-071108


無作為化試験は、介入の有効性と安全性を評価するための好ましい研究デザインである。しかし、そのような試験は法外な費用がかかったり、非倫理的であったり、時間がかかりすぎたりする。無作為化試験を実施できない場合、観察データを用いて同様の質問に答えることができる。これは、無作為化試験の研究デザイン原則を、介入の因果関係を推定することを目的とする観察研究に適用したものである。ターゲットトライアルは、観察研究によくある自業自得のバイアスを回避するのに役立つ正式な枠組みを提供する。

ターゲットトライアルエミュレーションの必要性
観察研究は、無作為化試験が高価、非倫理的、あるいは時間がかかりすぎるなどの理由で実行不可能な場合に、介入の有効性に関するエビデンスを提供することができる。観察研究は無作為化されていないため交絡バイアスに陥りやすいだけでなく、誤った研究デザインの選択(追跡開始時期の指定など)も自業自得のバイアスを引き起こす可能性があります。

ターゲットトライアルのデザイン方法
最初のステップは、利用可能な観察データの制約の中で、理想的に実施されたであろう試験のプロトコルを特定することである。この段階では、適格性基準、治療戦略、割付方法、結果、追跡調査、関心のある因果関係の対比(例えば、intention-to-treat効果)、統計解析計画などのいくつかの要素が検討される245。観察データはプラセボ対照試験を模倣して使用することはできないため、対象試験はプラグマティック試験でなければならない。ボックス1では、対象臨床試験のプロトコルの各要素を説明する。

The BMJ誌に掲載された論文10では、Urnerらが、covid-19関連呼吸不全患者の集中治療室入院後60日以内の病院死亡率に対する、従来の人工呼吸と比較した体外式膜酸素化治療の効果を推定するために、模擬的な無作為化対照試験について発表している。ターゲットトライアルの枠組みを用いることで、著者らはこのような観察研究のデザインによくあるバイアスを回避し、適切な統計手法(クローニング、打ち切り、重み付け)を用いてプロトコルごとの効果を推定した。この設定において、従来の統計手法(G手法ではない)を用いると、例えば、治療による影響を誤って調整することにより、さらなるバイアスが発生する可能性があった11。

ターゲットトライアルエミュレーションは、いつ、どのような理由で使用されるべきか?
ターゲットトライアルの枠組みは、観察データから介入の因果的効果を推定するために使用されるべきである。観察データを用いてエミュレーションする前に、ターゲットトライアルのプロトコルを明示的に定義することは、多くの一般的なデザインの落とし穴を避けるのに役立つ。例えば、ある治療法の一般的な使用者を含む観察研究では、選択バイアスが起こりやすい。8 このバイアスは、有効群の中に追跡調査開始前にすでに治療を開始していた参加者が含まれている場合に起こる。これらの参加者は、フォローアップ開始まで治療を受けている間、生存し、イベントフリーであり続けなければならない(適格基準に結果イベントの既往が明記されていない場合)。したがって、治療を開始し、この任意の期間を生き延びた参加者は、しばしば人為的に健康である。無作為化試験ではこのような選択バイアスは起こりえない。なぜなら、適格性評価の際には、参加者は生存しており、イベントがなく、対象となる治療を受けていないことが必要だからである。

結論
観察研究は、研究デザインに関係なく交絡の影響を受けやすい。しかし、観察データを用いた対象試験のエミュレーションは、成功すれば無作為化試験と同じ効果推定値を得ることができる。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


Invited Commentary Oncology
March 30, 2021
Trial Emulation and Real-World Evidence
Rolf H. H. Groenwold, MD, PhD1,2
Author Affiliations Article Information
JAMA Netw Open. 2021;4(3):e213845. doi:10.1001/jamanetworkopen.2021.3845

https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2777895

日常診療における医療行為の効果を推定するために、観察データの利用を提唱する論文が増えている。無作為化臨床試験(RCT)によるエビデンスとは対照的に、観察研究は実世界に適用可能なエビデンスを提供する、そう主張されている。

確かにRCTの結果がそのまま日常診療に適用されない理由はいろいろある。伝統的に、RCTでは治療効果を実証するために、厳格な対象・除外基準、参加者と研究者のマスキング、参加者の安全性と治療プロトコルの遵守の綿密なモニタリングといった理想的な条件が設定されている。さらに、RCTでは参加者とその治療担当医が明示的に参加を求められ(すなわち、インフォームド・コンセントを提供される)、それがさらなる選択の幅を広げることにつながるのである。

対照的に、観察研究は、電子カルテからのデータなど、いわゆる実世界のデータに基づいており、しばしば日常診療をよりよく表しています。しかし、無作為化およびマスキング(患者および医師)がないため、観察された結果が不偏であるかどうかは常に疑問である。また、電子カルテのデータの質はRCTのデータより劣る傾向があるが、同等と思われる例もある2。RCTと観察研究のもう一つの違いは、前者は通常intention-to-treat効果を推定するが、後者はprotocol毎の効果に注目することである。

III 期大腸がん患者における術後補助化学療法について、観察研究と RCT で異なる結果が得られている。Boyneら3 は、これらの違いが方法論的な問題によるものかどうかを検討した。彼らは、観察データを用いてRCTを可能な限り模倣する、target trial emulationと呼ばれる手法を用いた4。

Target trial emulationは、言うほど簡単なものではない。Boyneら3による研究の最初のコホートでは、参加者の20%以下しか解析に含まれていなかった。研究された治療戦略はRCTのものと完全に一致せず、観察研究のサンプルサイズ(485)はRCTのもの(12834)よりはるかに小さく、異なる研究からの効果推定値の間に差がある場合、それを検出する力は制限されます。Boyneら3は、観察結果の違い、特に不死時間バイアスによる違いを、方法論的に説明する方法を分離しようとした。ナイーブな観察的解析では、曝露レベルは実際の治療期間に基づいていた。この情報は研究追跡期間中に入手可能となり、したがって研究開始時点ではまだ入手できないため、不死時間バイアスのリスクが生じる。すなわち、ある曝露レベルを受けたと分類するためには、参加者がある時点まで生存していなければならない。その結果、術後補助化学療法の治療期間が短い者は、予後不良となった。不死時間バイアスは、標的試験がどのようなものかを明示することによって明らかになる、多くの可能性のあるバイアスの原因の一つである(すなわち、標的試験エミュレーション)。

Boyneら3によるtarget trial-emulated observational studyの結果は、確かにRCTの結果と一致し、観察データの素朴な解析の結果よりも一致した。これは、ターゲットトライアルエミュレーションによって、RCTと同程度に信頼できる観察研究が得られることを示しているのでしょうか?もし観察研究の結果がRCTの結果と一致するならば、前者のデザインと解析が有効であることを示唆しているのかもしれません。残念ながら、これは真実ではありません。


まず、異なる研究(異なるデザイン)間で治療効果の大きさが比較可能であることについては、別の説明もありうる。これには、偶然性、バイアスのキャンセル、データ解析時の選択(例えば、どの効果を推定するか)などがあります。

第二に、観察研究の妥当性に関する主張の前提は、結果は実際同じであるべきだということですが、そうである必要はありません。RCTと観察研究で異なる結果が得られるのには、様々な臨床的理由がある。選択性が重要である。この現象はしばしば効果修飾(effect modification)と呼ばれる。試験結果を標準化することで、効果修飾変数の分布の違いを克服することができるが5、これは測定された変数にのみ適用される。さらに、臨床試験に参加する医師は、経験豊富であったり、研究志向であったりするため、日常診療を代表するサンプルではない可能性がある6。さらに、ホーソン効果はRCTのように観察研究に影響を与えず、これに関連して、治療アドヒアランスも2つのアプローチで異なる可能性があります。

第三に、RCTは対象となる試験と一致する必要はない。例えば、Target trialはHawthorne効果やインフォームドコンセントの手続きによる選択の対象にはなりません。対象試験では、例えば、同意を得られない患者、小児、 妊婦を含めないという倫理的・法的理由は存在しない。RCTもtarget trialも医療行為に関する法律や規制(例えば、訓練を受けた外科医のみが手術を行うことを許される)に従わなければならないが、(概念的)target trialでは、医学研究に関する法律や規制を考慮する必要はない。

RCTとその観察型は比較されるべきですが、結果が異なる理由は方法論的にも臨床的にも多数あることから、比較はまず第一にデザインと分析の選択という観点からなされるべきです。標的試験のエミュレーションは、医療に関する研究の質と結果の解釈可能性を向上させる手段であり、これらの選択のための概念的なベンチマークとして機能することができる。観察研究が方法論的に健全である場合にのみ(これは、同じ治療法のRCTの結果との比較に基づく評価であってはならない)、我々はさらに検討し、その研究がどのような臨床的価値を付加するかを検討することができるのである。

RCTの結果と観察研究の結果を直接比較することには限界がある。なぜなら、両者の結果の違いには複数の説明がつくからである7。日常診療から得られた(現実の)データを有効性の比較研究に用いることは、交絡、欠損データ、誤分類など多くのバイアスの原因となりうる。実データに基づく観察研究は、RCTの結果の適用性を検証するものではなく、逆にRCTは観察研究の妥当性を示すリトマス試験紙でもない。しかし、観察された結果の違いについて考えられる説明(方法論的および臨床的)を徹底的に分解することで、RCTの結果の適用可能性と観察研究におけるバイアスの原因となりうるものについての洞察を得ることができるだろう。

~~~~~~~~~~~~~~~~~~~~


Target Trial Emulationについてはハーバードが2022年の夏からセミナーを開始したそうです。

いいですね、一週間の缶詰合宿。

画像5

一週間程度であれば、日本で働いている人でも参加できちゃうのではないでしょうか。


この記事が気に入ったらサポートをしてみませんか?