見出し画像

【医療データとAI】⑥外来で質問に「ある程度」答えられるように<3>「一次と二次利用」

再び私の役割

この【医療データとAI】シリーズは医療データやAIの最先端を追いかけることではありません。
そういったことはひとまず一部の最先端研究を行っている先生に日本や世界を引っ張って行ってもらいましょう。

私の役割は、次世代医療基盤法についての背景などの自分なりのイメージや理解を皆さんにお伝えして、先生方が外来で患者さんとコミュニケーションする際に役立ててもらおうということです。

なぜ私がその役割を?正直、全く詳しくないからです。
詳しい方にとっては当たり前過ぎで「どこが分からないかが分からない」状況なのです。
私にとっては正直「何も知らなかった」といっても良い状況ですので「分からないことが分かる伸びしろのある男」なのです。そういったことで良いモデルだと思います。

一問一答方式で

先日も一問一答方式で<1><2>を書きましたが、その続きを書いていきます。
(患者さんからの質問頻度高そう<高>質問頻度低そう<低>と頭に書いています。)


<低>「どの病院でもすでに論文や学会発表で匿名&仮名加工情報使っているのでは?」

「あえて、次世代医療基盤法という新しい法律ができるまでもなく、これまで個人を特定できないようにして論文とか色々書いているのでは?」という声があると思います。

はい、これまでも個人を特定できないようにして、医療情報を研究に利用することは可能でした、それにこれからも同じように論文や学会発表は出来ます。

しかし、次世代医療基盤法によって、医療情報の利活用をより促進するための制度が整備されました。次世代医療基盤法では、以下の点が従来の制度と異なっています。

  • 匿名&仮名加工医療情報の作成・提供を認定事業者によるものとすること

  • 匿名&仮名加工医療情報と、NDBや介護DB等の公的データベースとの連結解析を可能とすることで、より大規模なデータの分析が可能になりました。これにより、これまで困難だった課題の解決や、新たな発見につながることが期待されています。

  • 医療情報の利活用推進に関する施策への協力を認定事業者に義務付けること

これらの制度によって、医療情報の利活用がより円滑かつ効率的に行われることが期待されています。


<低>「これからはすべてのデータを認定業者に提供すべきなの?自分の施設では論文書けないの?」

いえいえ、これまでと同じように自分の施設で可能ですよ。

自施設で実施する研究開発のために、医療情報を自施設内で利用したいと考えている場合、認定業者への提供は必要ありません。ただし、その場合は、医療情報の匿名化・秘匿化に従来どおり十分配慮しながら行う必要があります。

自施設で論文を執筆するために、医療情報を利用する場合は、認定業者への提供は特に必要ありません。ただし、その場合は、医療情報の匿名化・秘匿化に従来どおり十分配慮しながら行う必要があります。

<高>NDBや介護DBとは?


NDB(レセプト情報・特定健診等情報データベース)と介護DB(介護保険総合データベース)は、日本の医療・介護の状況を把握し、その改善・向上に資することを目的としたデータベースです。

NDBは、医療保険の請求情報や特定健診・特定保健指導情報を収集・蓄積したデータベースです。このデータは、厚生労働省が管理しており、医療費の適正化や医療政策の立案などに活用されています。

介護DBは、介護保険の請求情報や要介護認定情報を収集・蓄積したデータベースです。このデータは、厚生労働省が管理しており、介護サービスの適正化や介護政策の立案などに活用されています。

次世代医療基盤法の改定前までは
(改定前の)次世代医療基盤法に基づく認定事業者のデータベースとNDB等の公的DBの連結は認められていなかった
●厚生労働省においては、公的データベースであるNDB・介護DBとDPCDBとの連結を令和4年に開始
●NDB、介護DBの連結に当たっては、被保険者番号の履歴を活用して正確に連結できる仕組みを創設(履歴照会・回答システム)

NDBと介護DBは、2023年10月1日施行の改正次世代医療基盤法に基づき、連結運用を開始しました。

<低>NDBや介護DB等の「等」とは?


厚生労働省の「改正次世代医療基盤法について」の資料にある「本法に基づく匿名加工医療情報と、NDBや介護DB等の公的データベースを連結解析できる状態で研究者等に提供できることとする。」とありますが「等」
とは?。

「連結可能匿名加工医療情報が取得できる→NDB(レセプト情報・特定健診等情報データベース)や介護DB(介護保険総合データベース)、DPCデータベース、全国がん登録データベース、指定難病患者・小児慢性特定疾病児童等データベース、MID-NET 等の既存DBと匿名加工医療情報を連結可」との記載をしているものもあります(引用元はこちらこちら

<低>DPCデータベースやMID-NETとは?


*DPCデータベース急性期病院の診療報酬請求明細書(レセプト)を基に、厚生労働省が作成したデータベースです。入院患者の診療内容や費用、退院後の転帰などの情報を収集しています。

DPCデータベースの「DPC」とは、「Diagnosis Procedure Combination」の略で、診断と治療の組み合わせを意味します。DPCデータベースでは、入院患者の診断と治療の組み合わせを、1つの診療群(DPC)として分類しています。
*MID-NET:MIDーNETとは、医療情報データベース基盤整備事業の一環として、厚生労働省と独立行政法人医薬品医療機器総合機構(PMDA)が共同で構築した医療情報データベースです。

MIDーNETには、全国10拠点の協力医療機関が保有する電子カルテ(オーダリング、検査結果等を含む)、レセプト(保険診療の請求明細書)及びDPC(入院費用の包括評価制度)の各種データが収集・蓄積されています。

MIDーNETは、医薬品等の安全対策の高度化を目的として構築されました。具体的には、以下の目的で活用されています。

  • 医薬品等の副作用の発現頻度の把握

  • 医薬品等の使用実態の把握

  • 医薬品等の適正使用の推進

MIDーNETは、製薬企業、研究者、行政等が医療情報の利活用を行うための基盤として活用されています。


このあたりは とにかく連結するとデータの精度が上がるという目的でしょうか?

<低>なぜ次世代医療基盤法が必要なの?


この回で書いてきたように
・これまで通り自分のデータで研究も可能
・これまで通り自分のデータで論文執筆も可能
・認定業者にデータを提供する義務はない

となると結局「なぜ次世代医療基盤法が必要なの?」ということになります。

医療情報の利用には一次利用と二次利用があります。
一次利用とは、患者の診療等によって得られた情報を本人の治療のために使用するなど、取得した本来の目的で使用することです。
個人が生涯にわたり自分自身に関する医療・健康情報を収集・保存して活用できる仕組みであるパーソナルヘルスレコード(Personal Health Record: PHR)や、地域における複数の医療機関の間で患者の診療情報をネットワークで共有する地域医療情報ネットワークは、患者本人の診断や治療を目的としているため一次利用に該当します。

二次利用とは、取得した本来の目的以外の目的で使用することです。治療の過程で収集した臨床データを新たな治療法の開発のために活用したり、調剤データや診療データを組み合わせて薬の副作用調査に活用したりすることは二次利用に該当します。先生方が書いておられる論文や学会発表も二次利用に相当するものです。

https://dl.ndl.go.jp/view/download/digidepo_11092418_po_1005.pdf?contentNo=1  から引用

すでに研究が出来ているので次世代医療基盤法なんか必要ないのでは?」と思われるかもしれません。

最近はEBM(Evidence Based Medicine)とうたわれて久しくなります。もちろん現場の臨床感覚も大切ですが、EVIDENCEに則る必要があります。その研究のEVIDENCEにも色々あるのです。

上の参考記事に非常にわかりやすく解説されていますが。
・メタ解析
・システマティックレビュー
・ランダム化比較試験
のようなエビデンスレベルの高いものと

・細胞を用いた研究
・動物を用いた研究
・症例報告
・ケースシリーズ
のようなエビデンスレベルの低いものと何が異なるのでしょうか?


私が理解するためのイメージですので、これが正解かどうかはわかりませんが。

まずは動物や細胞を用いた研究では人での結果ではありませんのでヒト臨床での利用にそのまま結果を外挿することは出来ません。

次に、先生のクリニックでの症例報告やケースシリーズを論文にした場合 それはリアルワールドの結果と近いものでしょうか?
やはり症例数が少なかったり、または有意差がある結果についての論文というPOSITIVE DATAですので良い方にバイアスが掛かっている可能性があるのではないでしょうか?

そこで症例数が広範囲から集められて数が多ければ多いほどばらつきが少なくなるのでは無いでしょうか?

そういった意味で次世代医療基盤法で多くのデータを集めて、改正後はさらに様々なDBに連結可能になっているのは意義のあるものかと個人的には思います。

現在は以下の図にあるように大病院から多くのデータを頂くことがメインになっていますが、大病院にかかる際には紹介状が必要になり基幹病院に気楽にはかかれなくなっております。そうなると同じ疾患でも大病院にかかっている患者さんとクリニックの患者さんで重症度や緊急性ののレベルに違いがありますのでバイアス要因になる可能性も高いです

そう考えるとタイムスケールについてはわかりませんが将来は小規模医療機関のデータも集める流れになっていくのではないでしょうか?

このように医療情報の二次利用を促進する上では、情報のビッグデータ化が有効となります。そのような意図が次世代医療基盤法にはあるのだと思います。

(図は以下のリンクからhttps://www.mhlw.go.jp/content/10808000/001166476.pdf

<低>医療ビッグデータは必要?


先程もデータの数が増えれば増えるほどバイアスが減っていくと思いますという意図で書かせていただきました。(しかし、医療機関数と医療機関規模の分布もリアルワールドを反映する必要がある?)

医療ビッグデータの必要性については、本当に機が熟し始めているかと思います。
皆さん2022年にChatGPTが登場して、初めの頃は間違った回答も多く使えないな‐ということも多かったと思います。これはハルシネーション問題といいます。ハルシネーション問題とは、AIが事実とは異なる情報を生成してしまう現象のことです。例えば、AIがニュース記事の要約を生成する場合、学習データに含まれていない情報や、学習データに含まれている情報の組み合わせとしてあり得ない情報を生成してしまう可能性があります。


AIのハルシネーションの原因は主に以下の2つの原因で起こっています。

①AIモデルの設計の問題
これについてはエンジニアの方のマターなので今回は割愛します

①学習データの質の問題

そういった場合には質の高い、数多くのデータ。そしてデータ分布もリアルワールドに近いデータを入れる必要があります。そうなると現在の大病院が中心のデータ取得というのは分布がリアルワールドには近くないので、いずれはできるだけ全データ取得を目指していくのでは?という推測を勝手にしております(繰り返しになりますがタイムスケールは不明ですが)

どんなに精度の高いデータと高質なAIモデルでもデータの質と量と分布がリアルワールドに一致していないとAIのハルシネーション問題は解決しないと思います。

これが進めば各国のデータを融合して世界中のデータバンクなどができれば素晴らしいですね。(もちろんNEGATIVE SIDEにもケアしながらです)

今日はここまで

しばらくはこうやって一問一答で患者さんの質問に答えられるようなイメージを伝えていきたいと思います。

シリーズ【医療データとAI】について

先生方とともに自分も学習したいので新しいシリーズ【医療データとAI】を開始しました。私にとっても未知の分野で認識の誤りなどもあるかと思いますがお許しください。
そしてNYAUWのブログの目的は難しいことが理解できない自分自身が学習の過程で掴んだイメージを皆さんにもお伝えすることですので
・卑近すぎる例 失礼に見える表現
・プロから見るとそうでないこともある
などがあるかもしれません。
しかし、できるだけイメージをつかみやすいように、内容を難しくしすぎないようにを心がけていきます。受験勉強の語呂合わせのようにイメージやストーリーを伝わりやすくするためにという悪意の無い目的ですのでお許し下さい。

AIという誰も経験したことのない分野と医療のクロス分野では倫理や哲学もまだ統一されたものもないため議論が世界中で多方面にこれから行われることになると思います。
そういった中で私個人が考える長期的なマクロの医療という視点でこのブログを書いてまいりたいと思います。ミクロな意味・短期的な意味では「不適切だ」か「反対」と思われる方もおられると思います。

・これはあくまで個人としての見解のブログであること
・世間的な未来予想に則ったもので、他の方の考えを否定するものではありません。

その点をご理解下さい。

今後はこの分野【医療とAI】のプロフェッショナルな方々に教えていただきたいので「教えてやるよ!」、または、まだまだ知らないので「一緒に勉強したい」という方まで連絡お待ちしております。


NYAUWの活動リンク

LINKTREEで作っております


KINDLE出版






よろしければサポートお願いします。 NYAUWの活動は現在マネタイズを考えずに意義のみを追求するフェーズです。 ニッチな分野のやせ我慢プロジェクトですので お気持ちだけでも嬉しいです。