非劣勢からの優越性検証

2024年4月27日 13:10

RCTを用いて臨床研究を行うにあたり、非劣勢モデルでのサンプルサイズ設計を行った。プロトコール上では、非劣勢が検証された場合、引き続き優越性についても検討する旨記述した。ところが、サンプルサイズについては優越性モデルでは検討は行っていない。試験の結果、非劣勢も優越性も検証出来たが、優越性について事後にサンプルサイズが適切であったどうかを説明するためには、どのような項目について計算を行えば良いか？

RCT（ランダム化比較試験）において優越性の主張をサポートするために、非劣勢モデルを用いたサンプルサイズ設計に加えて、優越性モデルでのサンプルサイズが適切であったかを検証することは重要です。優越性を事後的に検討する際に計算すべき主要な項目は以下の通りです：

効果量の推定: 優越性分析で見込まれる効果量（treatment effect size）を推定します。これは、新治療と標準治療間の差として計算されることが一般的です。
実際のサンプルサイズ: 試験に実際に参加した被験者の数を考慮します。
標準偏差または誤差の推定: 実際の試験データから得られる標準偏差または誤差の推定値を使用します。
αエラー（第一種過誤）のレベル: 通常、優越性試験ではα = 0.05 (5%) を使用します。
検出力（1-βエラー）: 優越性が存在する場合にこれを検出できる確率。通常は80%または90%が望ましいです。

これらの情報をもとに、次のような計算を行うことができます：

サンプルサイズの再計算: 実際の効果量、標準偏差、αエラー、検出力を用いて、理論上必要だったサンプルサイズを計算します。
事後検出力の計算: 実際のサンプルサイズと実際の効果量を用いて、どの程度の検出力があったかを計算します。

これにより、試験が統計的にどの程度の信頼性を持っていたかを評価し、優越性についての結果が偶然によるものではないことを示すための裏付けが得られます。実際のデータを使用してこれらの計算を行う場合は、統計ソフトウェアを用いることが一般的です。必要であれば、具体的な計算手順やソフトウェアの使用方法についてもお手伝いできます。

Post-hoc power の計算によって、事前に設定した1-β（0.8や0.9）を超えていれば、症例数的には十分であったと考えて良いですね。

はい、その通りです。事後検出力（Post-hoc power）の計算は、実際の試験データに基づいて行われるため、試験が実施された後にその試験の統計的妥当性を評価するのに役立ちます。事後検出力が事前に設定した1-β（例えば0.8や0.9）を超えていれば、使用されたサンプルサイズが効果の検出に十分であったと解釈できます。
これにより、試験結果の信頼性が高まり、研究結果が実際に臨床的な意義を持つかどうかを裏付けることができます。ただし、事後検出力が高いからといって、研究設計の他の側面（例えばランダム化プロセス、試験実施の質、データの完全性など）の重要性が減るわけではないことに注意することが重要です。

この記事が気に入ったらサポートをしてみませんか？