なぜ1年前の人口データを使うことが問題なのか

「未記入を未接種に」問題には続きがあります。年齢階級別人口データとして1年前のデータを使って人口当たりの陽性者数を示すと何が問題なのかを、改めて整理してみようと思います。(内容はこれまで書いたものとほぼ同じ。あまり整理できていないと感じたので、補足説明を加えながら整理してみました。)

結論:
・未記入を未接種とすることで、未接種の感染者数が多く計上していた
・1年前の人口データ利用により、高齢者のワクチン効果が高く見えている
⇒データを操作しようとしても、結局どこかで破綻する


(1)問題の概要(ずっと以前から以下の問題がありそうなことを把握、指摘していたおられた方がいため、厚労省も5月11日に問題を認めざるを得なくなりました。こちらにそれまでの経緯を説明して下さっている方がいます。)

問題1:5月11日の第83回アドバイザリーボードの資料にて、陽性が判明した人の発生届の接種歴未記入の人数が未接種にカウントしていたことを公開。
⇒ワクチン未接種の陽性者数が多く見えてしまう

問題2:5月20日厚生労働委員会、国民民主党の田中議員の質問に答える形で、使用している年齢階級別人口データは令和3年1月を基準としていること、そして陽性者数は感染時の年齢を使って集計していることを厚労省が認め、改善を約束した。ワクチン未接種者数は、ワクチンを1回以上接種した人の人数を引いたものであることも明らかにした。
⇒年代別・10万人あたりの未接種者の陽性者数が正しい値にならない。
(90歳以上では、未接種者の人数が異常に少なく計上される)


(2)説明

問題1接種歴未記入の人数が未接種にカウント)は、接種していた可能性がある陽性者も含め多くの人を未接種に計上することで、未接種で陽性になる人が多く見えるという問題でした。この部分は、厚労省が第83回アドバイザリーボード資料で認めているため、少しづつ報道されています。
なお、未記入は陽性者の20%前後もあるため、集計してもかなり誤差が多くなっていると推測できます。ただ、多くの人が指摘しているとおり、未接種なら未接種と簡単に答えられる、3回接種なら接種してから日が浅いので接種日を答えやすいでしょう。従って「未記入」になるのは2回接種したが接種日がわからないケースが大半かも知れません。すると、2回接種の効果はさらに低い可能性があると言えるのではないでしょうか。


続いて問題2(1年前の年齢階級別人口データを使用)について。

まず、未接種者の人数がおかしくなります。例えば、未接種・90歳以上の10万人あたりの1週間の陽性者数を計算するには、本来は
  分子:その1週間に確認された未接種・90歳以上の陽性者数
  分母:その時の未接種・90歳以上の人数
とすべきです。未接種の人数は、その階層別人口データから接種した人数を引いて計算します。
しかし実際には一部で異なるデータが使われていました。分母の計算の元になる90歳以上の年齢階級別データとして1年前のデータを使っていたのでした。高齢化が進む中、高齢者の人数は増えています。従って、90歳以上の総人口が実態より少ないとして計算が行われていたわけです。(速報値で比較すると、90歳以上は247万人から263万人、人数では16万人、率にして6.5%増えています。)

画像6

90歳以上の未接種の人数は、90歳以上の人数から登録されたワクチン接種人数を引くことで得られます。その元の数字が16万人少ない訳ですから、未接種者の人数は実際より16万人少なくなります。第83回アドバイザリーボードの資料では、わずか2913人になっていました。実際には、2913人に約16万人を加える必要があるはずでした。(アドバイザリーボードで使っている年齢階層別データとは、完全には一致していません)


続いて未接種者の人数がおかしくなったために起きたことを考えましょう。90歳以上の計算上の未接種者の数が少なくなっていたため、10万人あたりの陽性者数は増えてしまいます。相対的にワクチン接種した方が人口あたりの陽性者数は少なくなります。こうしてワクチンの効果が非常に高いように見えていました。
但し、ワクチンの効果が高く見えるか、低く見えているかは、その階層別人口の増減によります。以下は、後に示すグラフの年齢区分にまとめた結果です。

画像6

90歳以上は6%以上増えていますが、65歳~69歳は逆に6%減っています。戦後の第1次ベビーブームの人たちの一部が69歳から70歳になったのだと理解できます。このため、この世代のワクチン効果は、厚労省資料では本来より低く計算されているはずだ、と理解できます。


続いてワクチンの効果を数値化してみましょう。
本来ワクチンの有効性は、

「ワクチンを接種しなかった人が病気にかかるリスクを基準とした場合、接種した人が病気にかかるリスクが、『相対的に』どれだけ減少したか」という指標で示されます。

実際の例で考えてみましょう。アドバイザリーボード第83回の資料の一部です。

画像7

2回接種の効果は、1-73.1÷4119.5 で計算できます。ワクチン未接種ならば10万人あたり4119.5 が感染していたが、2回接種では73.1人だけ感染した。73.1÷4119.5 =0.0177・・ 1.77%なので、逆に言えば、98.2%の感染を抑えられた、と。本当なら、当初のファイザーの有効性95%を超えたすごい効果です。

なお、厳密には、有効性を示すために治験は接種を受けた人も医師も、それがワクチンかブラセボかがわからない状態で行われます。しかし、今はそれができないので、「後ろ向きの評価」という方法で有効性を計算しています。(バイアスが入ってくる可能性が高いため、前向きの評価ほどは信頼性は担保されません)


最後にグラフを見ておきましょう。はじめに10万人あたりの陽性者数です。問題の多い未接種者の値を、アドバイザリーボードの数字をそのままグラフ化しました。(これを書くまでに、第88回アドバイザリーボードの資料が公開されるかと待っていましたが、まだのようなので、前の記事と同じグラフになっています)

画像8

10万人当たり、4月11日からの1週間で5000人、つまり5%の人が感染した、というデータになっています。
90歳以上未接種のデータを外し、グラフの縦軸をそろえた結果はこちら。他の年代、例えば50歳代が少し多く、65歳~69歳が少ないように見えます。

画像9

2回、3回接種は未接種ほど不自然ではありません。

続いて、効果を確認します。

画像10

予想通り、人口が実態より多くなっていた65歳~69歳では、2回接種、3回接種共に効果が異様に低いように見えています。

続いて人口データを修正した結果です。(2回、3回接種は上に同じ)

画像11

とても自然な形になりました。そしてワクチン接種の効果は、以下のとおり。年代別の不自然なギャップが完全になくなりました。

画像12

なお、本来は信頼区間などを示すべきですが、今回はそれを行っていません。特に最近の未接種90歳以上の感染者数は126人、95人と非常に少なくなってきたため、データの信頼性は少し低いと思います。


おまけ:
第84回アドバイザリーボードから、90歳以上の未接種者数を公表していません。今回改めて数字を確認したら、この期間の接種者数は4729人増えていました(2,366,598 人から2,371,327人に増加)。つまり、もしも第84回でも数字を記入していたら、未接種者数がマイナスになっていたはず。ワクチンの接種率も100%を超えた!となるはずでした。どう考えても書くことができなかったのだ、と理解しました。

統計データは、互いに関連し、整合性があることが重要です。このように、一部で細工をしても、どこかで破綻します。データを大事にしないと、必然的に起こること。

こんなにリアルに、データを大事にしない事例を目にすることになるとは。とても残念でなりません。データを隠さず公開し、広く扱えるようにしてくれれば、このような問題は一切起きないし、データへの信頼度もあがるはず。

たとえ為政者にとって不都合なデータでも、いじってはいけないのです。


資料:

第83回アドバイザリーボード公開資料(3週間分が一度に公開された)

画像1


画像2


画像3


第81回アドバイザリーボード公開資料:4月10日分までは、未記入が未接種に含まれていた。90歳以上の未接種者は11907人。

画像4


その他のリンクはこちら。「全国の新規陽性者数等及び高齢者のワクチン接種率等」。