見出し画像

Centorスコアはなんのため?

McIsaac,Centorスコアは溶連菌咽頭炎の診断について識別力がよくないという系統的レビュー

https://www.clinicalmicrobiologyandinfection.com/article/S1198-743X(23)00633-X/fulltext#%20

に対して,「Centorスコアはそういう風に使うものではない,というCentor先生の嘆き。

以下主張を要約すると・・・

・ROCが0.7くらいだということは1980年に最初に報告した時から知っている
・これらのスコアは治療も検査もしなくてよい情報をもたらすもの
・スコア0〜1は検査も治療もしなくてよい。仮に0か1点で培養または迅速抗原検査が陽性になったとしてもこれは保菌状態と区別がつかない。偽陽性の可能性が高い。
・どのガイドラインも0〜1点では,検査も治療も推奨しないことは一致している。
・2点の場合,検査の意味がある。
・3〜4点の場合は(私見では)臨床判断だ。
・咽頭痛に対して抗菌薬を処方するのはGASのみだという誤った仮定をしている。思春期,若年成人のFusobacteriumの咽頭炎を無視している。→これらはスコア3,4点で治療するもう一つの理由だ
・欧州各国は,すべての咽頭痛をあまり大した問題ではないと考えている。confirmation bias(確証バイアス)の問題がある。

ここからは私の私見ですが,予測モデルの精度の評価指標には,discriminationとcalibrationがあります。AUROCはdiscriminationを評価する指標で,アウトカムの有無を識別する指標です。calibrationは予測確率と実際の確率の一致度のようなものです。
これらは一般的にはトレードオフの関係にあり,特殊な例外を除いてどちらも完璧にすることはできません。
一般に,AUROCは0.9とか高ければ高いほどよいとされますが,これだとcalibrationが悪くなることがあります。calibrationがよいモデルだと,AUROCは0.7〜0.8になってしまうことは普通にあります。
どちらの指標がより大事か?というよりは,その予測モデルをどのように使うかによります。
これもあまり明確に決まっているわけではないのですが,個人的には,最終的なアクション前はdiscriminationの高さが大事,次のアクションをどうするか(検査を追加するかどうか?など)の判断の際にはcalibrationのよいモデルで,予測確率を見積もって判断するのがよいと思います。
昔,色々な国でのCentor,McIsaacスコアの研究を見たとき,各スコアで溶連菌陽性の確率は結構似通った数字だったと記憶しています。多分,これらのスコアはcalibrationはよい指標なのだろうなと思っています。

この記事が気に入ったらサポートをしてみませんか?