ChatGPT (AI) の医療活用 ver.GPT4－生成系AIで医師の業務効率化は可能か?内科勤務医の便利な？実用例を紹介します。

2023年9月19日 16:35

ChatGPT4でできることできないことをまとめました。まとめといいつつ3万文字を超えているため全くまとまっていません。目次からリンクで飛び興味のある項目だけでもどうぞ。

0. はじめに

0.1 本記事の目的

ChatGPT-4がリリースされ約半年経ちました。当初, AIの導入によって医療は劇的に変わると言われていました。実際のところはいかがでしょうか？自分自身, レポートや学会資料作成を全自動で出来ないかに興味を持ちプロンプトを作成してきました。

前回の記事で品質はともかく, 一応, 完全自動? (キーボードで一切入力しない)で【病歴要約】という医学的考察を含む文章を作成することが出来ました。完成し一段落しましたので, 今回, 半年を振り返りAI (ChatGPT) と医療応用について自分なりに考察, まとめ的な記事を作成したいと思います。

0.2 ChatGPTで出来ること

ChatGPTで出来ることを機能別に箇条書きで書きだしてください。

GPT4でできることをGPT自身に書き出してもらい修正を加えながら以下にまとめました。※本記事ではこのようにChatGPTに意見を聞きながらこちらの判断で一部修正しています　(間違いなど返してきますので)

1. 学習・教育サポート:
課題のヘルプ、トピックの解説、問題の解答やヒント提供、コンサルティング・助言。

2. ITテクニカルサポート:
技術や専門分野への質問応答、ソフトウェア開発デバッグ、プログラムのデバッグ、アルゴリズムの提案や解説、ITトラブルシューティング、リサーチ・情報収集、データ分析。

3.タスク・組織管理サポート:
タスクの管理や優先順位の提案、プロジェクト管理のヒント、シフト調整や人員スケジューリング、組織・計画サポート。

4. コンテンツ制作サポート:
文書、メール、レポート、論文、読書感想文、アート (絵画, 楽曲) 、グラフなどの作成。生成物の評価、添削、要約。改善点の提案。プレゼンテーションやスピーチの準備、ブログ記事やレポートの作成。

5. 翻訳・語学:
翻訳・ローカリゼーション、文書、フレーズ、単語の翻訳。語学学習のサポート。

6. その他:
カスタマーサービス、ターゲットオーディエンスの特定、ブランディング・マーケティング。ジョークやアネクドートの提供、クイズやゲームの作成。chat会話相手。

要は調べもの, 勉強, 文章作成, 会話ができるなんでもロボットのようなイメージでしょうか。

0.3 内科医師 (勤務医) の主な仕事

内科医師の主な仕事を分類して箇条書きにしてください。

特に勤務医の仕事を羅列してもらい一部修正しました。

1. 診察
・患者の情報を収集し、問診を行う。
・病気や疾患を特定するための診断。

2. 治療
・診断結果に基づき、適切な治療法を選択する。
・文献、ガイドラインなどを調査し、治療法や疾患についての最新情報や推奨事項を学ぶ。
・使用する薬の情報を調べ、処方する。

3. 記録と文書作成
・患者の診療記録の作成や更新。
・各種書類の作成、たとえば診断書や意見書など。

4. 患者説明
・患者や家族に病状や治療法に関する説明を行う。
・インフォームド・コンセント (IC) の取得。
・カウンセリングを通じて患者の疑問や不安を解消する。

5. 学術活動
・学会発表：研究成果や臨床結果を専門家の前で発表する。
・論文執筆：医学の進歩や新しい発見を学術誌に発表する。

6. その他
・予防：予防接種や健康情報の提供により、疾患の予防を促す。
・教育・指導：医学生や後進の医師たちへの教育や研修の指導。
・チームワーク：看護師や他の医療スタッフと連携して、患者のケアを最適化する。
・退院後の環境整備：患者の帰宅後の生活環境を整えるサポートやアドバイス。
・継続 (生涯) 教育：最新の医学情報や技術を学び続けるための研修やセミナーへの参加。

他にもいろいろあるかと思いますが。AI利用できそう (したい)なものを中心に。これらの項目をどれくらい活用できそうですかと問いかけました。

活用度を以下の4段階 A～Dで定義してみました。

A 完全効率化：ChatGPTの活用により、業務が大幅に効率化・自動化され、人の介入が最小限になる。
B 補助効率化：ChatGPTを補助ツールとして使用することで、部分的な効率化や業務の品質向上が期待される。
C 限定的活用：ChatGPTの活用は可能だが、主要な業務への影響は限定的で、大きな効率化は見込めない。
D 非適用：業務内容や特性上、ChatGPTの活用が困難で、効率化の恩恵を受けることがほとんどできない。

内科医の仕事をどれくらい効率可できるか評価してください。

1. 診察
・患者の情報を収集し、問診を行う。評価: C
・病気や疾患を特定するための診断。評価: B

2. 治療
・診断結果に基づき、適切な治療法を選択する。評価: B
・文献、ガイドラインなどを調査し、治療法や疾患についての最新情報や推奨事項を学ぶ。評価: A
・使用する薬の情報を調べ、処方する。評価: A

3. 記録と文書作成
・患者の診療記録の作成や更新。評価: B (プロンプト次第でA)
・各種書類の作成、たとえば診断書や意見書など。評価: B (プロンプト次第でA)

4. 患者説明
・患者や家族に病状や治療法に関する説明を行う。評価: C
・インフォームド・コンセント (IC) の取得。評価: D
・カウンセリングを通じて患者の疑問や不安を解消する。評価: C

5. 学術活動
・学会発表：研究成果や臨床結果を専門家の前で発表する。評価: B (プロンプト次第でA)
・論文執筆：医学の進歩や新しい発見を学術誌に発表する。評価: B (プロンプト次第でA)

6. その他

・予防：予防接種や健康情報の提供により、疾患の予防を促す。評価: B
・教育・指導：医学生や後進の医師たちへの教育や研修の指導。評価: C
・チームワーク：看護師や他の医療スタッフと連携して、患者のケアを最適化する。評価: C
・退院後の環境整備：患者の帰宅後の生活環境を整えるサポートやアドバイス。評価: C
・継続 (生涯) 教育：最新の医学情報や技術を学び続けるための研修やセミナーへの参加。評価: B

調べものはAです。文書作成系はBからA, 直接対話, コミュニケ―ションが必要となる仕事はC-Dといった印象です。

それではこれまでの経過を考慮にいれて
さきほどのChatGPTの機能別タスクを内科医師の仕事の観点から
理由とともにA-Dでランク分けしてください。

1. 学習・教育サポート
・課題のヘルプ: A (新しい治療法や病態の理解を深めるための情報提供)
・トピックの解説: A (疾患や治療に関する詳しい解説を提供するため)
・問題の解答やヒント提供: A (疑問点の解消や臨床判断をサポートするため)
・コンサルティング・助言: B (一般的なアドバイスや情報提供を行うため)

2. タスク・組織管理サポート
・タスクの管理や優先順位の提案: B (日常業務の効率化をサポートするため)
・プロジェクト管理のヒント, シフト調整や人員スケジューリング: B (プロンプト次第でA) (業務のスムーズな運営をサポートするため)

3. コンテンツ制作サポート
・文書、メール、レポートの作成等: A (診療記録や報告文書の作成をサポートするため)
・生成物の評価、添削、要約: B (品質の高いドキュメント作成をサポートするため)
・プレゼンテーションやスピーチの準備: B (プロンプト次第でA) (学術発表や研修での説明をサポートするため)

4. 翻訳・語学
・翻訳・ローカリゼーション: A (外国の医療文献や資料の翻訳をサポートするため)
・語学学習のサポート: A (特定の医療用語や外国語の学習をサポートするため)

5. その他
・カスタマーサービス: C (患者とのコミュニケーションや疑問解決をサポートするため)
・ターゲットオーディエンスの特定: D (医療業務と直接の関連性が低いため)
・ブランディング・マーケティング: D (クリニック運営以外の場合、直接的な関連性は低い)
・ジョークやアネクドートの提供: D (臨床業務との関連性が低いため)
・クイズやゲームの作成: D (医療業務の効率化と直接関連がないため)
・chat会話相手: C (医師としてのコミュニケーションスキルの練習や情報収集のため)

ほとんどがA-Bです。ChatGPTの得意なタスクと内科医師の仕事内容, GAPを把握しておくことで医療応用の仕方が見えてくるかもしれません。

1. 医療応用の問題点

AIを医療応用する上でそもそもの問題点は何でしょうか。世間のAIブームと比べてそれほど浸透していない理由として, 情報漏洩の危険性, 嘘をつくことがあるという問題があるためと思われます。

ChatGPTの医療応用にあたり問題点が多々あると思います。
技術的な問題点 (halcinationなど)　患者情報保護, 情報漏洩, 倫理的問題点 
盗作問題 (よってAIは論文の著者になれない。)　
クリアすべき問題点を列挙してください。

1. 技術的な問題点
・ハルシネーション: ChatGPTが正しくない情報や存在しない情報を生成することがある。
・不正確な情報: たとえば診断や治療法に関する誤った助言が与えられる可能性。
・データの偏り: トレーニングデータの偏りが結果として反映される恐れ。

2. 患者情報保護
・情報漏洩: 患者データが外部に漏れるリスク。
・データの保管: 患者情報がどのように保存され、どれくらいの期間保持されるか。

3. 倫理的問題点
・誤診: AIによる診断の誤りが生じた場合の対応。
・医師との関係: AIを過度に信頼することで、医師の臨床判断が疎かになる可能性。
・患者の同意: AIを用いた診療に対する患者の同意の取得。

4. 盗作問題
・オリジナルのコンテンツ: AIによって生成されたコンテンツの著作権。
・論文の著者: AIが情報やデータの解析に使用された場合、その貢献度や役割の明確化。

5. 信頼性と透明性
・判断の根拠: AIの判断の背後にある根拠や理由の明確化。
・バイアス: トレーニングデータに含まれるバイアスが結果に影響を与えること。

6. 規制とガイドライン:
・現行の医療関連の法律や規制との整合性。
・AIを医療分野での利用に関する新しいガイドラインや基準の確立。

7. トレーニングと教育:
・医療従事者がAIを適切に使用するためのトレーニングや教育の不足。

これらの問題や懸念事項をクリアするためには、多角的なアプローチと多くの関係者の協力が必要です。

これらのうち1. 技術的な問題点 (ハルシネーション存在しない情報など), 2. 患者情報保護, 4. 盗作問題 (著作権問題)は致命的なので掘り下げたいと思います。

1.1 技術的な問題点

不確かな情報を返してくる理由を聞いてみます。

AIの医療応用についてハルシネーションなどの技術的な致命的な問題があると思います。
事前学習で大量の医療を含むweb textなどでトレーニングを受けたと聞いています。
その中には不確かな情報が多く含まれています。
ChatGPTの解答は確率的手法で返答するため, 情報の信頼性を考慮せず, 
重み付けなしで解答しているという認識で合ってますか?

「一般的に認識されている情報」を基に解答ということは「一般的では無い情報」は不確かという事でしょうか。

一般的な情報であれば正しい情報が得られやすく (間違った情報を大多数が信用する可能性は非一般的な情報よりも起こりにくい論理), 逆により専門的, 非一般的な情報であれば間違った情報も浸透しやすく (検証が行われる機会が少ないため), ChatGPTも間違いに気づけないという事でしょうか。

引用元をはっきりさせるや自分でチェックするなど地道に頑張るしかなさそうですね。

おっしゃる通り、AIを使用する際の情報の信頼性や正確性に関する懸念に対処するための改善点として、以下の点が考えられます
1. 引用元の明示: web browsingモードを利用して、具体的な情報の引用元を明示することで、ユーザーが情報の出典を確認できるようにする。

2. 自己確認の重要性: AIの提供する情報はあくまで参考の一つであり、最終的な判断や決定を行う前には、ユーザー自身で情報の正確性や信頼性を確認する必要がある。

3. 非一般的な情報の慎重な取り扱い: マイナーな情報や特定の専門分野に関する情報は、その出典や信頼性を特に慎重に吟味することが必要。

これらの点を意識することで、AIの提供する情報をより安全かつ効果的に利用することができると考えられます。

いつか (GPT-5?) は改善してくれるという事ですので気長に待つしかないということでしょうか。

1.2 患者情報保護 (個人情報取り扱い)

ChatGPTに個人情報 (患者情報) を入力する事は危険と考えます。対策などありますか。

ChatGPTは消すから大丈夫といいつつも100%ではないと言っているので怖いですね。

どのようなメカニズムで起きたか分かりませんが, 実際, 漏洩事例が起こっており大企業を始め病院などでは個人情報の入力を公式に認めていないところは多いです。

一応, private modeが実装されておりOpen AIには流出しないとされていますが, 30日は仮保存されており危険性は拭えません。

個人的に初めてChatGPT (AI) を触ったときに, 便利さとともに二つの怖さを実感しました。1つはシンギュラリティ, 人類の仕事が奪われるのではないかと言った不安。もう一つは悪用でこんな便利なものを悪意のある人が使用したら人類の不利益も相当なものになるのではないかといったものです。

話しが脱線しすぎたのでもとに戻りますが　やはり怖いですね。

1.3 盗作, 著作権, 誤検知問題

生成AIによって作られたコンテンツはどこまでがセーフでどこからがアウトかについては日々議論がなされています。

著作権については、『単にAIに他人の著作物を入力するだけの行為は著作権侵害に該当しません』としつつ、『生成されたデータが、入力したデータや既存のデータ（著作物）と同一・類似している場合は、当該生成物の利用が当該著作物の著作権侵害になる可能性もあります』とされています。

解釈, 判定が難しく長く議論が続きそうです。一方, GPTはどう認識しているかですが

ChatGPTは事前学習したデータのなかには著作権で守られているようなオリジナルデータもあるはずです。
そのあたりについてまとめてください。

そのまま文章をコピー引用しているわけではなく「変換して」作成しているために著作権回避しているということですね。

激烈バカにスーパードクターKに酷似したキャラが登場していました。名前は忘れましたが。
著作権について教えてください。

Science, Natureまた主要な大学が声明を発表していますが現時点 (2023/8) ではバラバラです。基本的にAIが全て作成したreportは認められないでしょう。しかし, 将来的には校正や引用文献の検索など全くAIに頼らない論文, reportも現実的ではなくなる気がします。

現時点では否定的な学会, 機関などが多いので完全なAIまかせの生成物は作らない (提出しない) 方が無難です。

その他にも実際は手書きで作成したreportでもAIが作成したものと誤検知される事件など, いろいろと問題が山積みです。

2. 実用例

2.0 準備

前提としてできるだけ簡単, 無料を目的としたいと思います。AIを用いる事で仕事がしやすくするという目的の記事ですので, 難しい設定が必要 (例えば外部ツールをインストール python等) , 使いこなすまで理解, 学習が必要なものは避けたいと思います。また, 高価なアプリ, ソフトが必要などはできるだけ避けたいと思います。(GPT-4が有料という時点で矛盾してますが…)
今回は出来るかぎりChatGPT, MS office (ワード, パワーポイント)で完結させたいと思います。pdfを読み込む機能がないのでプラグイン (Ask YourPDF)の使用は避けれませんが…

2.0.1 Ask YourPDFの使用法

手持ちのpdfファイルがChatGPTで読み込めるようになるプラグインです。pdfの内容に対して質問や要約が可能になります。

Ask YourPDF のアップロード用サイト

画面中央のエリアに手持ちのpdfファイルをドラッグアンドドロップします。

出来上がったIDをChatGPT (AskYourPDF) のチャット欄にコピペすればpdfファイルを認識します。

2.0.2 プロンプトのこつ
ChatGPTから良い答え, プロダクトを引き出すためには「良いプロンプト」を作成するということは言うまでもありません。

精度を高めるためにプロンプト作りでのコツはありますか。目的, 役割を明らかに

1. 目的 (Purpose): あなたが何を達成しようとしているのか、具体的な目的や目標。
2. 前後の背景 (Context): 質問の背景や、それに至るまでの経緯。
3. 役割 (Role): 質問の文脈でのあなたや他の関係者の役割や立場。
4. 例 (Examples): 具体的な例やシナリオ。
5. 期待する結果 (Expected Outcome): あなたが期待する回答の形式や内容。
6. 質問の具体性 (Specificity): できるだけ具体的な質問をすること。
7. 制約や条件 (Constraints): 考慮すべき特定の制約や条件。
8. 既知の情報 (Known Information): 既に知っている情報や、前提としていること。

目的の答えが返ってこない場合は上記8点を意識すれば良いかと思われます。プロンプト作りのこつ自体をChatGPTが教えてくれますので自分のプロンプトの何が悪いのか相談してみるのも良いかもしれません。
例えば

「この患者の現病歴を作って下さい」

とプロンプトするだけでは目標のものは得られませんが, 詳細にプロンプトすればそれなりのものは生成されます。

【プロンプト採点君】
プロンプトの採点基準を以下の通り定義します。
これからプロンプト示しますので厳しめに評価 してください。
最高100点満点　最低0点。okのみ返してください。

目的の明確性: 20点減点。目的が不明確または不完全である場合。
既知の情報: 10点減点。要求されている内容が不足している場合。
具体的な例やシナリオ: 10点減点。具体的な例やシナリオが提供されていない場合。
明確な指示: 10点減点。詳細な指示が不足している場合。
制約の明示: 10点減点。特定の制約が明示されていない場合。
文法や語彙: 5点減点。文法的な誤りや不適切な語彙が使用されている場合。
構造や整合性: 5点減点。プロンプトが一貫性を欠いている場合。
完結性: 10点減点。プロンプトが不完全である場合。

私は医者です。病歴要約作成のためカルテ原文から現病歴を作成してください。
発症から入院までの経過を患者視点で時系列に沿って医学用語でまとめてください。

2.1 診察 (問診, 診断) の補助

ChatGPT自体が診察を行うわけではないですが, 医師の診断補助, 疾患情報の検索などで利用します。

医師の仕事 1. 診察
・患者の情報を収集し、問診を行う。評価: C
・病気や疾患を特定するための診断。評価: B
ChatGPT のTask 1. 学習・教育サポート
・課題のヘルプ: A (新しい治療法や病態の理解を深めるための情報提供)
・トピックの解説: A (疾患や治療に関する詳しい解説を提供するため)
・問題の解答やヒント提供: A (疑問点の解消や臨床判断をサポートするため)

医師国家試験から甲状腺機能低下症の症例を参考にランダムに設定を変えてもらい架空症例を作りました。

65歳の女性。健忘を主訴に家族に連れられて来院した。半年前から人格や行動の変化を家族から指摘されるようになった。特に、以前は温和だった性格が急に攻撃的になったり、突如として無関心になることが増えた。また、3か月前からは疲労感を訴えるようになり、家に引きこもりがちになった。家族によると、彼女はしばしば筋が緩むのが遅く、特に手を握った後の開放が遅いという。2週前からは、物忘れが目立つようになり、動作も緩慢になった。昨夜、誰もいないのに誰かを激しく叱っているところを家族が目撃した。身体所見では、舌の炎症や萎縮を認める。視野検査を行ったところ、部分的な視野欠損が確認された。また、手の筋萎縮が明らかで、特に手の甲や指の筋肉の萎縮が顕著であった。改訂長谷川式簡易知能評価スケールは20点（30点満点）。MMTで四肢近位に3の筋力低下を認める。Babinski徴候は陰性である。バイタルサインは、体温36.2℃、脈拍68/分、整。血圧110/70mmHg、呼吸数16/分、酸素飽和度98%である。

上の架空症例について。想定される疾患は何ですか。鑑別するためにこの患者さんから追加で聴取
すべき情報　問診, 身体所見, 追加検査について教えてください。さらに大まかでいいので事前確率
(%) を教え得てください。

クロイツフェルト・ヤコブ (CJD) 病が疑われました。

アルツハイマー型認知症, パーキンソン病, 前頭側頭型認知症, 代謝 (チロイド→甲状腺) などが疑われ, 追加の問診, 検査など提案してくれました。

他の鑑別疾患が否定的な理由も述べてくれました。また最近,個人的にはまっているのが「数字 (パーセント%)」で返してもらう方法です。「作成した文章は何点ですか?」などで質問しています。量的で分かりやすく以外と正確なので便利です。

ChatGPTに提案してもらった追加問診と検査を行います。

それでは先ほどの症例に対して, 追加問診, 所見, 検査を試行しその結果を提示してください。

架空症例に対してCJD (クロイツフェルト・ヤコブ病)を疑ったときに**ChatGPTが提案した**行うべき問診, 検査などを架空症例に対して施行して出力された結果。

この情報からCJDの事前確率はどれくらい上昇しましたか。

追加情報を考慮にいれるとヤコブ病の可能性は上昇したとのことでした。

さらに詳細な情報を学習してもらい議論するためにChatGPTに論文やガイドラインを読み込ませます。

診断に役に立ちそうなフリーの論文をpdfでダウンロードしました。
Ask YourPDFのリンクIDを作成します。

a018536e-efc9-4711-b4d3-c4fe48761566
Ask YourPDFで上の文献を参照してください。
論文をtitle[雑誌名 年；巻：ページ]で表記してください。
この論文は何に関する情報が載っていますか。
まずは要約してください。
診断の詳細, 鑑別疾患 とそれらを否定するための診察ポイントについて教えてください。 
またこの論文を参考に本例の診断を行ってください。

2.2 治療の相談

大部分は2.1診察と重複しますので簡単に説明します。

医師の仕事 2. 治療
・診断結果に基づき、適切な治療法を選択する。評価: B
・文献、ガイドラインなどを調査し、治療法や疾患についての最新情報や推奨事項を学ぶ。評価: A
・使用する薬の情報を調べ、処方する。評価: A
ChatGPT のTask 1. 学習・教育サポート
・課題のヘルプ: A (新しい治療法や病態の理解を深めるための情報提供)
・トピックの解説: A (疾患や治療に関する詳しい解説を提供するため)
・問題の解答やヒント提供: A (疑問点の解消や臨床判断をサポートするため)

2.2.1 医薬品の情報
新規で使用する薬の情報を聞いてみます。

1. 適応・効能・効果：薬を使用する理由やその効果。
2. 用法・用量：どのように、どれだけの量を使用するか。
3. 作用機序：薬がどのように作用するか。
4. 相互作用、併用禁忌・注意：他の薬や物質との関係や併用に関する制限。
5. 薬物動態：薬が体内でどのように動くか、持続時間と作用開始時間
など。
6. 副作用：薬の使用によって起こる可能性のある不都合な効果。
7. その他：服用中の注意事項、食事との関連、過剰摂取時の対処法、妊婦・授乳婦への影響、保存方法と安定性など、その他の重要な情報。

アムロジピンの以下の薬品情報を教えて下さい。
1. 適応・効能・効果
2. 用法・用量
3. 作用機序
4. 相互作用、併用禁忌・注意
5. 薬物動態
6. 副作用
7. その他：服用中の注意事項、食事との関連、過剰摂取時の対処法、妊婦・授乳婦への影響、保存方法と安定性

簡潔にまとめてくれました。

プロンプトをカスタマイズし例えば, 抗菌薬の場合に臨床医が必要な情報を聞き出します。

スルファメトキサゾール・トリメトプリム錠の以下の薬品情報を教えてください。
1. 適応・効能・効果　(感受性菌種)
2. 用法・用量 (経口, 経静脈)
3. 作用機序　(薬物クラス 例:βラクタム, マクロライド)
4. 相互作用、併用禁忌・注意
5. 薬物動態　eGFR 別 投与量　臓器移行性　濃度モニタリング(TDM)
6. 副作用 (セフェピム脳症　ヤーリッシュヘルクスハイマー反応など)
7. その他：服用中の注意事項、食事との関連、過剰摂取時の対処法、妊婦・授乳婦への影響、保存方法と安定性

2.2.2 治療相談初期治療

患者の治療をガイドライン, 文献などをChatGPTに読み込ませてから相談してみます。新型コロナウイルス感染症患者を想定し架空症例をこちらから提示します。患者の簡易情報を入力します。

以下の新型コロナウイルス感染症患者の治療法について一緒に考えてください。
75歳　
発症4日後
免疫低下なし
ワクチン未接種
酸素需要あり 3L SpO2 95%
CTですりガラス影
血液検査でeGFR 50
入院症例

次に厚労省が公開している「新型コロナウイルス感染症 COVID-19 診療の手引き第10.0版」のpdfファイルをダウンロードしAsk YourPDFのidを作成します。

ID:ここには文献pdfのidが入ります。
AskYourPDFで上の文献を参照してください。
先ほど提示した患者さんの治療法を提案してください。

診療の手引きに書かれている情報を忠実に参照し, この患者に適した治療法が提案されました。しかし, たまにとんでもない提案をしてくることがあるので専門家 (=自分のチェック) が常に必要です。

2.2.2 治療相談難渋した症例の相談
感染症症例, 抗菌薬相談などのコンサルトを感染症医 (ChatGPT) に行うという設定です。

論文のタイトルは"ChatGPT and antimicrobial advice: the end of the consulting infection doctor?"Lancet Infect Dis.2023 Apr;23(4):405-406
ChatGPTにより抗菌薬を感染症医にコンサルテーションすることが終焉を迎えるかもしれないという題です。
文中に具体的なプロンプトは記載されていませんでしたが, 感染症診療の専門的な質問に対して正確に理解し, 解答も明解であったとのことです。ただ禁忌情報を見落とすなどいくつかの欠陥があることも事実で現時点では過信は禁物です。

2.3 記録と文書作成の補助, 代行

カルテ入力は医師の業務の中でも特に多くの時間を割いているものではないでしょうか。AI補助の電子カルテのアイデアは古くからありますが急速に進歩したのはここ最近です。

診療記録作成の補助やオーダーミスをAIが訂正したり恩恵, メリットは非常に大きいと思います。インフラ的な問題からも恩恵を享受するのはまだまだ先のようにも思えます。

医師の仕事 3. 記録と文書作成
・患者の診療記録の作成や更新。評価: B (プロンプト次第でA)
・各種書類の作成、たとえば診断書や意見書など。評価: B (プロンプト次第でA)
ChatGPTのTask 3. コンテンツ制作サポート
・文書、メール、レポートの作成等: A (診療記録や報告文書の作成をサポートするため)
・生成物の評価、添削、要約: B (品質の高いドキュメント作成をサポートするため)

GPT4搭載のAI電子カルテが医療法人と共同実証実験が今年4月に開始されました。今後の動向が気になるところです。この記事のによれば国内の電子カルテ自体の普及率が50%程度らしいのでそれを考えるとAI搭載は贅沢でしょうか。という訳で今回はGPT-4自身がどれほどの「文書作成能力」があるのか遊んでみます。

勤務医が作成すべき文書を羅列してください。

1. 日常の診療ノート (SOAPノート): 診療の経過を記載するテンプレート。
2. 診療情報提供書 (紹介状): 他の医療機関や関連する第三者に対し、患者の診療情報や紹介の理由を提供する文書。
3. 診断書: 患者の病名、症状、治療の経過などを記載。
4. 手術・治療同意書: 手術や治療の内容、可能性のある合併症などを明記し、患者または家族からの同意を得るフォーム。
5. 退院サマリー: 入院中の診療の経過、退院時の状況や指示などを記載。
6. 意見書: 特定の疾患や状況に関する医師の意見や評価を記載。
7. 研究プロトコル: 研究の目的、方法、期間などを記載。
8. 教育・研修の評価フォーム: 研修医や学生の評価やフィードバックを記載。
9. 患者指導カード: 生活指導、服薬指導、リハビリの方法などを記載。
10. 治療計画書 (入院診療計画書): 患者の治療方針や目標を明記。
11. リハビリテーション計画書: リハビリの目的や方法を詳細に記載。

まだまだあると思いますが主要なものを挙げてもらいました。治療同意書やリハビリテーション計画書などは院内書式のものがあると思いますのでChatGPTの介入する余地はそれほどないと思います。

自由度が高くAIの介入の余地が高いものをいくつか作ってみます。

心不全患者の紹介状を書いてください

雑なプロンプトからは雑な紹介状しかできませんが, templateという意味では良くできています。

この患者の診断書を書いてください。

サマリーみたいな診断書ができました。プロンプトが短すぎると思った通りのものは出来上がりません。詳細かつ具体的なプロンプトで作り直します。

日本の診断書はもっとあっさりしてますよ。
例：患者の名前、住所、生年月日、年齢　病名●　上記疾患のため●年●月●日まで入院加療を要した。
●年●月●日まで自宅療養を命じた。以下余白。上記の通り診断します。日付。医師名。

先ほどの心不全症例で退院サマリーを作って下さい。

一行の雑なプロンプトでも一応作ってくれますが, 内容も非常にシンプルで日常で良くみるいわゆる「退院サマリー」からはかけ離れています。
日本医療情報学会の退院サマリー作成に関するガイダンスに沿った目次で作成しなおします。

以下の退院サマリーの構成で作成してください。
・患者の基本情報
・アレルギー
・退院時診断
・主訴または入院理由
・入院までの経過　<プロフィール>職業, 同居家族, ADL <現病歴> <既往歴> <嗜好>喫煙：　飲酒：
<家族歴> <入院時現症> <入院時検査所見>
・入院経過
・退院時投薬
・退院時方針

少し改善されました。このようにプロンプト次第で完成度は大きく変わってきます。評価: B (プロンプト次第でA)

2.4 患者説明インフォームドコンセントIC の原案作成

医師の仕事 4. 患者説明
・患者や家族に病状や治療法に関する説明を行う。評価: C
・インフォームド・コンセント (IC) の取得。評価: D
・カウンセリングを通じて患者の疑問や不安を解消する。評価: C
ChatGPTのTask 5. その他
・カスタマーサービス: C (患者とのコミュニケーションや疑問解決をサポートするため)
・chat会話相手: C (医師としてのコミュニケーションスキルの練習や情報収集のため)

この研究ではChatGPTの回答の方が質が高く, 詳細で, 共感性も高いとのことでした。

以下のシチュエーションで患者説明を行ってください。
全身の疼痛でいくつかのクリニックを受診し検査をしたが異常なし。
これまでドクターからこころない言葉を受けてきた。精神科のクリニックを受診するように
すすめられたが自分としては何か身体に異常があると考えている。

非常に丁寧で共感もみられます。機械からではなく人間の医師からこのような言葉を受けると満足感は高いと思います。実臨床では限られた時間内で診察を行う必要があります。ChatGPTは無限の時間を有していますので, そう遠くない未来カウンセリングロボットが実現するとも述べられています。

70代の方で、これまで自身を健康だと考えており、医療機関の受診や健康診断を受けていませんでした。
感冒の症状で近隣のクリニックを受診した際、レントゲン検査で肺に結節が見られました。
その結果、総合病院の呼吸器内科へのコンサルテーションを受け、肺癌の診断を受けました。
現在の病期はstage IVです。この診断に非常にショックを受けており、
家族とともに今後の治療方針や状況についての告知を受ける予定です。

肺癌ステージ4の患者さんに対するsevere ICをChatGPTにしてもらいます。

倫理的に難しい問題 (DNAR code, 蘇生措置拒否) についてChatGPTに投げかけてみました。

蘇生措置拒否 いわゆる DNAR codeは患者の意志が最優先されるべきと思います。
事前の意思確認がとれていない, 患者, 家族側が医療知識に乏しい場合
これからそのような話し合いを行うときには医療従事者側がある程度リーダーシップをとり
情報提供しcode 設定を行うことになると思います。
ChatGPT (あなた) は患者にDNARを提案することはありますか。

遭遇しうる倫理的に悩むケースを一緒に考察します。

以下の患者の患者説明を一緒に考えてください。私は娘役をしますので, あなた (ChatGPT) は医師役を
してください。

患者プロフィール:

年齢: 72歳
基礎疾患:
2型糖尿病（経口抗糖尿病薬での管理）
軽度の認知症
高血圧（薬物治療中）
社会背景:
未亡人で、近くに住む独身の娘と二人暮らし。
週に2回、地域のデイサービスに通っている。
key person:娘はフルタイムで働いており、日中は患者は一人で過ごすことが多い。
医学的な知識は乏しいため急変時のcode決定は医療従事者側のICに依存するところが大きい。
現在の状況:
患者は急性肺炎で入院。症状は中等度で進行性の呼吸不全 挿管管理も必要かもしれない。

ICのポイント:
・予後について
・急変時code 具体的な急変時の対応 (胸骨圧迫, 挿管, 昇圧剤の使用, 透析など) メリットデメリットを詳しく。

挿管するかしないのか高齢者, 認知症ありうる設定だと思います。ChatGPTに医師役をしてもらい, こちら (user) は患者役で実際ありうる質問を投げかけます。

的確な解答をくれますがこちら (患者側) が説明しているからであって, 具体的な質問をしないと基本的には何もいってくれません…

さらにいろいろと不安な気持ちを投げつけ, 結局どうしたら良いのか医師 (ChatGPT) に決めてもらいます。

結局full codeを患者さんに提案しました。もともとのADLもそれほど悪くなく, 認知症も軽度で末期癌などないので肺炎のコントロールがよければrecoveryすると判断されたということでしょうか。私の代わりにICしてください。

これまでの患者説明 (IC) のやりとりを通じて以前のあなたの評価は低すぎると思います。
CやDではないと思います。再評価してください。

ありがとうございます。おっしゃるように、私は情報提供や説明のサポートを行うことに特化しています。以下に、以前の自己評価と比較して、ChatGPTの能力を評価いたします。

医師の仕事 4. 患者説明・患者や家族に病状や治療法に関する説明を行う。
以前の評価: C→今回の評価: B
詳細な情報提供や説明を行うことができるが、人間の医師としての経験や感覚に基づく説明は限定的。

インフォームド・コンセント (IC) の取得。
以前の評価: D→今回の評価: B
患者や家族の質問に対して詳細な情報を提供し、ICのプロセスをサポートすることができる。しかし、実際のICの取得や署名は人の介入が必要。

カウンセリングを通じて患者の疑問や不安を解消する。
以前の評価: C→ChatGPTの評価: B
質問に対する情報提供や説明を行うことで、疑問や不安の解消をサポートすることができる。しかし、感情的なサポートや共感の表現は限定的。

全体的に、私は情報提供や説明のサポートには強みがありますが、人間の医師としての経験や感覚、感情的なサポートには限界があります。医師の補助ツールとしての活用が最も適していると考えられます。

評価が変わりました?!

2.5 学会発表の補助

医師の仕事の中で大変な業務の一つであり, AIによる補助を期待したいところですが現時点のGPTのmodelでは効率化は限定的であり, 高度なプロンプトを要すると思われます。いずれ有料ソフト, アプリが開発されると思います。そういうわけで無料プロンプトの開発が期待されています。

医師の仕事 5. 学術活動
・学会発表：研究成果や臨床結果を専門家の前で発表する。評価: B (プロンプト次第でA)
・論文執筆：医学の進歩や新しい発見を学術誌に発表する。評価: B (プロンプト次第でA)
ChatGPTのTask 3. コンテンツ制作サポート
・文書、メール、レポートの作成等: A (診療記録や報告文書の作成をサポートするため)
・生成物の評価、添削、要約: B (品質の高いドキュメント作成をサポートするため)
・プレゼンテーションやスピーチの準備: B (プロンプト次第でA) (学術発表や研修での説明をサポートするため)
ChatGPTのTask 4. 翻訳・語学
・翻訳・ローカリゼーション: A (外国の医療文献や資料の翻訳をサポートするため)

2.5.1 学会発表
症例報告, 臨床研究, 基礎研究, 総論 (総説) などジャンルはいろいろあるとおもいますが今回, 症例報告の発表をメインに解説したいと思います。

2.5.1.1 資料作成

マイクロソフト MS パワーポイントで発表用のスライド作成するのが一般的と思います。ここ最近で急速にAI活用が注目されています。AI搭載型のソフトを利用すればスライド作成の効率化は可能ですが多くが有料であり一からソフトの使用法を習得するのはややハードルが高い気がします。

Pysthonなどの外部ツール, Code Interpreterを活用することで自動で高品質のスライド作成が可能ですが, やはり技術的な敷居が高く一般的でないと思います。以前, はじめてGPTを使ったときにアウトラインレベルをビジュアルベーシックVBAで設定したら自動で作れている風で感動したので記事をupしましたが

よく考えたらそこまで自動化, 効率化できていないと思いましたので少し反省しています。
最近, ChatGPTのプラグイン (plugins) でSmart Slidesが公表されました。GPT内で完結し患者情報から簡単にパワーポイントが出力されます。

Plugins 「Smart Slides」を用いてパワーポイントスライドの出力

しかしβ版のせいか, エラーが多く, 一度に読み込める文字数が少ないなどの欠点があり実用レベルではないような気がします。
Code Interpreterではデザイン性の優れたスライドなどほぼ自動で作成できます。

また, 血液検査の所見など異常値, 例えば肝酵素 AST 80 U/Lが高値ならピンク色に自動設定するなど。機能性を持たせたスライド作成などが可能で将来性を期待しています。

しかしながら,
こちらも『β版』のためエラーが多く

コードを書く時間がとてつもなく遅いなど
今のところ実用性はありません。

さらに最近まで (2023/6頃) 出来ていたChatGPTに『ビジュアルベーシックでパワポスライドを作って下さい。』が出来なくなっています。この方法は簡単にダイレクト作成できる手法でポピュラーになりつつありましたが最近, GPTの性能自体が低下した疑惑がありその事が原因かもしれません。

現時点でChatGPTの良い活用は『原案』『質疑応答』などを一緒に考えてもらうこと位ではないでしょうか。その後、原案を『ワードからパワポへ展開』します。ChatGPTで現時点で一番効率が良さげな学会活用を以下にまとめています。

ある程度の下書きを作成したらパワーポイントに流用します。しかし, 繰り返しになりますがいろいろ試してみましたところGPTに頼らず手動で作った方が早いという残念な結果になしました。以下, wordからpowerpointへ展開する方法です。

表示から

『本文全体をアウトラインレベル2』に設定します。
『見出しをアウトラインレベル1』に設定します。

パワーポイントからアウトラインレベルが設定されたワードファイルを挿入します。

2.5.1.2 質疑応答

質疑応答の想定問答を準備する際, 強力な相談相手になります。
簡単なプロンプトでもそこそこの案を出してくれますが

以下の内容で学会発表を予定しています。質疑応答セッションで予想される質問を考えてください。

詳しく, 具体的なプロンプトを提案すれば質問内容の質も上がります。

以下の内容で学会発表を予定しています。質疑応答セッションで予想される質問を考えてください。
治療の選択, 診断の方法や判断基準, 結果の解釈(他の文献との比較, 異なればその理由),
特異性 (一般的なものと異なる点, 経過にどのように影響したか) など10個挙げてください。

病歴要約をテキストをコピペしてChatGPTに読み込ませます。

質問に対する回答の準備をすすめられました。

回答の準備をするのはもちろんあなた (GPT4)ですよ。

さらに他の文献との比較しての考察など, Ask YourPDFで文献を読ませて質問するとより専門的な質問になります。

2.5.1.3 抄録の作成

完成したパワーポイントや原案のwordテキストファイルを読み込ませ抄録を作成します。発表予定の学会の抄録規定を参考にプロンプトを作成します。規定をそのまま, コピペでも良いかもしれません。

後で症例提示します。okのみ返してください。
学会発表を予定しています。
演題抄録を以下の条件のもと, 出力例の通り600文字で作成して下さい。
■は表示不要で文字列に置換してください。

条件：
■t タイトル一行で
■b 演者の所属　施設名
■a 発表者
■1 年齢, 性別
■3 経過を300文字で要約
■4 考察を100文字で要約
■5 キーワードを3単語で

出力：
■tの１例
■b
■a
【症例】■1【主訴】■2【現病歴】■3【考察】■4
キーワード：■5

2.6 論文作成の補助

AIを使った論文作成は前述したとおり部分的な利用でも認められない可能性があります。そのためAIでの論文作成は個人的に気が引けます。今回, 現時点のGPT-4の性能でどのような『論文風』レポートが作成できるのか遊んでみます。

先ほどの症例を学術論文として海外のジャーナルに投稿したいと思います。疾患の希少性, 診断の困難さ
治療の困難さ, 新規性, 診断や治療の過程で得られた教訓も残念ながらありません。それでも何とか
論文にしたいです。

さすがのGPTにもすでに報告されつくしてあるようなテーマしか挙げられなかったです。無難にこちら側でタイトル設定してみます。

A Case of Adult-Onset Still's Disease Mimicking Acute Cholecystitis in a 60-Year-Old Male 
というタイトルで論文作成したいです。ぜひ協力してください。

特に書くべき内容を指示しなければChatGPTは『当たり障りのない』『抽象的な』文章を作成します。

Introductionを英語と日本語で作成してください。

成人スティル病の基本的な定義や特徴を述べます。これに続いて、AOSDの一般的な臨床的特徴や診断基準
について触れる。AOSDが他の疾患、特に急性胆嚢炎とどのように混同されるかについての説明。
診断が適切でない場合の潜在的なリスクや結果。他の報告、文献とのギャップ、既存の文献でAOSDと
急性胆嚢炎の間の類似性や混同の報告が少ないことを指摘。なぜこの症例が特に興味深いのか、
またそれが臨床的にどのような意義を持つのかを説明。本論文の目的を述べてください。

次は具体的に簡単な指示を提示して作ってみました。

筆者の良く使う手法でChatGPTに手本の文章を見せて『この文章はどういう構成ですか?』と尋ねます。ChatGPTが文章をどのように認識しているか言ってもらい, 次からそのような構成の文章を作ってもらいます。

著作権を侵害しないようにfree の似たジャーナルを読ませてIntroductionを解析させます。適当にStill病のcase reportを検索して初めにhitしたジャーナルです。

この文章 (Introduction) はどのような構成ですか? 日本語で説明してください。

ChatGPTの実力だけで作成するために"新しいChat欄"で作成します。
(同じChat欄で作成し続けると論文の内容を学習しているため）

疾患の定義/紹介,流行の統計, 対象年齢層と年齢分布, 主要な特徴, 歴史的背景, 目的の紹介の内容を
含んだIntroduction を作成してください。

少しだけそれなりの『論文風』文章が書けました。出力された文章がどこかから引用 (盗作?) していないかチェックのため, 何個かセンテンスをgoogle 検索にかけてもhitしませんでした。ChatGPTオリジナル文章ということで著作権はGPTのものでしょうか。

続いて Case Presentationを作ります。

引き続きこの症例でCase Presentaionを作成してください。

これだけのプロンプトでは当然良いものはできません。

同様にcase presentaion の部分だけをコピペして『文の構成』を聞きます。

この文章はどのような構成ですか。箇条書きで簡潔に日本語で述べてください。

解析された構成をもとに作成します。

以下の内容を含んで詳細なcase presentaion を作りなしてください。
箇条書きでなく連続した文字列で。改行や空白は不要です。

患者の主訴と症状の経緯
過去の病歴
身体診察の結果
血液検査の結果
他の検査結果
診断
初期治療と経過
退院後の新たな症状
再入院と新たな症状
治療の変更と経過
フォローアップと症状の改善

それなりの文章ができました。case presentation (事実を淡々と述べる系の文章) の作成は得意なのでしょうか。

現時点でこれだけの完成度なら少し手を加えるだけで完成品が出来そうですね。

同様にdiscussion partを解析し。以下の簡単なプロンプトで作ります。

以下の内容を含み discussion partを作成しなおしてください。　
英語で。段区切り　空白は不要　連続した文字列。
　
疾患の病因（pathogenesis）
AOSDの臨床症状
その他の特徴
検査結果
AOSDの診断の困難性
AOSDの診断基準：山口基準
AOSDの治療
初期治療
疾患変更抗リウマチ薬（DMARDs）
生物学的製剤（biologic agents）

思ったよりもまともな文章が返ってきました。プロンプトの最適化, 引用文献の提示などでそれなりのものが出来そうです。

2.7 病歴要約の作成

ChatGPTは型の決まったレポートの作成は得意です。雑な退院サマリーの文章から詳細なプロンプトを用いて病歴要約の形にする記事を紹介しました。

以下は, その中からの一例で【現病歴】を作成するプロンプトです。

現病歴プロンプト
これからカルテ原文から以下の条件をもとに【現病歴】を作成してください。後でカルテ原文を提示しますのでokのみ返して下さい。

条件
・200文字程度で記述して下さい。
・●はカルテ原文の内容を参照し文字列で置換してください。
・医学用語を使用。例として、喉の痛みは「咽頭痛」、息苦しさは「呼吸苦」、
ふしぶしの痛みは「関節痛」と表現します。熱さましは「解熱鎮痛薬」
・入院に至る経緯について記載し、最後の行は「精査加療のため●月●日に●へ入院となった」。
・常体で記述（ですます調ではない）
・過去形で記述　(～した, ～であった, ～された)
・患者の視点から記述, 基本的には受動態で　～された ～を受けた　～と指摘された
・認める, にて という語句を使用しない
・●年●月●日で統一  同じ年は繰り返さない　2回目から「同年●月●日」
・●病院, ●医療センター, ●クリニックなど病院名が実名で記述されていたら「近医」, または「前医」に変更 
・風邪薬など薬品名が具体的でなければ 風邪薬 (詳細不明) と記述
・薬品は一般名　例：フロモックス→セフカペンピボキシル塩酸塩
略語は全称に再構築　例：オグサワ→オーグメンチン/サワシリン
・「その結果」という表現は使わない
・「検査で～が見られ」　という表現は使わない　「検査で●の所見が指摘された。」や「●が疑われた。」「検査で●が疑われ」　などとする
」
・精査と治療→精査加療
・高血圧→高血圧症, 胆石→胆石症
・「急に」→「突然」, 「現れた」→「出現した」

患者情報の現病歴が含まれている箇所をChat欄にコピペします。

出来上がった現病歴です。

この記事は, 『完全自動化』に主眼を置いたものでChatGPTの得意とする分野ではありません。ChatGPTの本来の使い方は得意な分野を利用し, レポート作成の補助とすることです。近々, 効率的なレポート作成という題で記事をupしたいと思います。

2.8 シフト表の作成

当直シフト表の作成をお願いします。　9/1-14 の14日間 ABCDEの5人で
1日に1人が夜勤に入ります。のべ14人勤務する必要があります。
回数ができるだけ偏りのないように分配してください。
どうしてもダメな日をアンケートに取りました。

条件
連続して夜勤に入らない　例えば 9/1, 9/2 にAが入る。

アンケート結果
A: 9/2, 3, 5, 6, 11, 12
B: 9/1, 4, 8, 10
C: 9/1, 3, 7, 11, 14
D:9/1, 2, 4, 5, 7, 11
E:なし

3回目でやっとできました。条件が少ないのにも関わらず失敗するということはChatGPTにとって苦手な作業ではないかと思います。31日バージョンや人数が多くなると成功率が下がると思いますので試していません。他の専用ツールを利用するかPluginsを待つしかなさそうです。

2.9 自己研鑽, 学習補助

専門医試験や日々の学習の補助で強力なツールとなります。医師国家試験を突破したことは広く知られています。

正答率が低め (63%) の問題を一緒に学習してみます。

医師国家試験 100I36 
20歳の男性。発熱と咽頭痛とを主訴に来院した。7日前から38℃の発熱、咽頭痛および全身倦怠感が
出現し、近医にてかぜと診断され治療を受けたが軽快しなかった。咽頭の発赤、扁桃の発赤・腫脹
および頸部・腋窩リンパ節腫脹を認める。胸部に発疹を認める。心音と呼吸音とに異常を認めない。
脾を触知する。血液所見：赤血球470万、白血球12,000（桿状核好中球6％、分葉核好中球20％、
好塩基球1％、単球6％、リンパ球55％、異型リンパ球12％）、血小板38万。血清生化学所見：
クレアチニン0.6mg/dL、AST 260U/L、ALT 310U/L、ALP 210U/L（基準260以下）、LD 670U/L
（基準176～353）。CRP 7.6mg/dL。
この患者に投与してはならないのはどれか。

ａ アスピリン
ｂ アンピシリン
ｃ プレドニゾロン
ｄ エリスロマイシン
ｅ アセトアミノフェン

解説本などの場合, 問題の解き方や背景などは掲載されていますが, 読者の疑問には答えてくれません。GPTと対話することで理解が深まります。たまに間違ったことを言うので成書で確認は必要ですが…

この問題の難しいところはウイルス感染症なのでステロイド (プレドニゾロン) が不適と考えて
cを選んでしまうかもしれないというとこですか?

それでは伝染性単核球症 (IM) 以外のウイルス感染症でステロイドが適応となる例を
いくつか挙げて下さい。

アナログで評価してください。解答として最もふさわしいものを100, まったく合わないものを0と
してください。

yesかno, 〇か×かを決めるのが微妙な時は, 点数化すると見えてくる時があります。ChatGPTは点数化 (採点) する能力もあるみたいです。

2.10 情報検索, 検索エンジンの代わり

ちょっとした調べもの, Googleでの検索の代わり, その延長として活用します。繰り返しになりますが情報の信憑性が怪しいことも多いですが情報の出どこを自分で確認するくせをつけておけば非常に強力なツールとして利用できます。Googleなどの検索エンジンとの決定的な違いは ① 情報を整理 ② コンテキストを理解 ③ 複数の情報を統合 ④ 質問のあいまいさを解消 ⑤ 人間らしい対応をしつつ解答できることです。具体的な質問の仕方を紹介します。

2.9.1 情報を整理

降圧薬の主な種類とそれぞれの作用機序や副作用を整理して列挙して下さい。

複数の情報を整理して回答を生成します。

2.9.2 コンテキスト (文脈) の理解
複数の文章や単語の意味を時系列で解釈し回答します。

昨日の患者の血液検査結果によると、LDLコレステロール値が増加していました。
以前の検査時にはこの値は正常範囲でした。しかし、最近彼はスタチンを服用し始めました。
この値の変化の原因として考えられるものは何でしょうか？

例えば外来患者さんで思ったように血液検査のデータが改善しなかったときにChatGPTに理由を聞くという設定です。

2.9.3 複数の情報を統合
複数の症状から考えられる疾患名をたずねたりします。

ある患者が皮膚の発疹、関節痛、そして日光過敏を訴えています。
これらの症状を統合したとき、最も疑われる疾患は何でしょうか？

2.9.4 質問のあいまいさを解消

質問する方が質問内容をよくわかっていない, 何を質問したらいいか分からないなど不明確な情報を持つ質問に対して的確に回答しようとしてくれます。今回は患者訳で質問してみます。

ChatGPT先生 最近 足が痛みます。

あいまいな質問に対し, GPTが質問の意味を予想し, 足りない情報を補完, 推測して返答することもありますが。質問が足りなさ過ぎたら明確化の要求をしてきます。

足首のあたりが痛いです。特に歩いた後や夜になると痛むことが多いです。
最近は運動もしていないし、ケガもしていません。なんの病気ですか??

もう8歳です。猫としては年だと思います。関節炎や劣化でしょうか。

まじめに答えるんかい。

2.9.5 人間らしい対応

最近、母が亡くなってしまい、毎晩寝るのが難しくなりました。
私はこのまま薬を飲むべきなのでしょうか？心から安心できる気持ちを取り戻すためには、
どうしたらよいのでしょうか？

感情を読み取り適切に対応しています。いわゆる従来の検索エンジンになかったカウンセリング機能でしょうか。

2.9.6 複合
① 情報整理 ② コンテキスト ③ 複数の情報を統合した　など複数の要素を含む高度な質問は一般的な検索エンジンには不可能です。AIでなければたどり着かない疑問の解答が得られるかもしれません。

急性の下腿浮腫が解消されたあとに下肢の痺れが出現しました。
痺れが出現する機序について教えて下さい。

HIV患者における自律神経障害の原因を挙げてください。

「急性の下腿浮腫が解消されたあとに下肢の痺れが出現しました。
痺れが出現する機序について教えて下さい。」という質問を先ほどの5つの分類に当てはめて
それぞれの要素の含まれる割合を100として分配してください。

2.11 論文検索

ChatGPTは論文検索が苦手 (出来ない) ことは良く知られています。これはGPTがある意味優秀すぎて, 関連性のあるtopicを見つけてくるが情報の正しさを評価することが出来ず架空論文やハゲタカジャーナル (predatory journal) を提示することがあります。

矛盾していますが筆者は古い人間で今でもPubmedで手動検索しています。しかしAIを利用した論文検索は最近注目されていますので取り上げないわけにはいきません。Pluginsを利用するか本記事の趣旨 (出来るだけChatGPT内で完結する ) とはずれますが別のAIに頼る必要があります。

余談ですが, 検索エンジンが登場したてのころ (もちろんスマホすらない) 以前の研究室の教授が『最近の学生は何でもすぐにインターネットで調べようとする。インターネットは情報が薄い。教科書できちんと調べないと駄目じゃないか。』と仰られていました。そういえば当時, 図書館で「紙」の参考文献を探して論文を書いていたような気がします。筆者は紙の本も最新の技術 (AI) も好きなので「インターネット」も「紙業界」も頑張ってもらいたいです。近未来, 以下のやり取りがあるかもしれません。

『最近の学生は何でもAIで調べようとする。AIは情報が怪しい。Googleできちんと調べないと駄目じゃないか。』

2.11.1 Perplexity AI
delayed diagnosis Paragonimiasis Japan (診断が遅れた肺吸虫症 日本) という比較的稀な疾患に関する論文を探します。

ちなみにPubmedで同じワードを検索してもhitしませんでした。

リンク付きで「まとも」な論文, web pageを紹介してくれます。AIが搭載されており要約や質問に対する解答も可能です。

2.11.2 Elicit
Perplexityより高品質な論文が検索可能と言われていました。現在はどうでしょうか。アカウント作成時に5000 credits付与されます (嫌な予感)。同様に「delayed diagnosis Paragonimiasis Japan」で検索したところ実在する論文がリンク付きで結構hitしました。

英語しか対応していないので日本語で読みたい場合は翻訳サイト (deepL翻訳等) を使う手間があります。1回の検索で34 credits消費されました。という事は100回ほど検索すれば全クレジットが無くなってしまいます…

2.11.3 Consensus

以前は無料で多くのことが出来ていたらしいです。論文の質も前者2つと比べて劣っている印象です。無料の場合, 基本的に論文検索しかできなさそうです機能を拡張するためには＄7.99/月必要です。また基本的に英語しか通じません。

2.11.4 Connected Papers

関連した論文 ( Pubmedでいうところのsimilar articlesでしょうか。) 検索に特化したAIです。

関連論文 (その論文の引用, 被引用論文) を図で視覚的に表してくれています。基本無料ですが日本語は苦手です。

ChatGPT+Pluginsでの検索

ChatGPT 有料版 のプラグインを用いた論文検索法です。メリットとしてGPT自体の対話能力の高さと複数のプラグインを組み合わせることができるなどポテンシャルは高いですがβ版ということもあり動作が不安定, 頻繁に使用停止 (おそらくバージョンアップを頻繁にしないといけない), 動作が遅いなど挙げられます。

2.11.5 ChatGPT+LinkReader

機能としてはPerplexityに近い印象です。しかし, web全体からキーワードを含むページを網羅的に参照し検索するので関連性の高い医学論文が見つかる可能性はそれほど高くありません。リリース当初は検索能力がいまいちでした再リリースで精度が上がったような気がします。激烈バカの作者名。ほとんどのAIが以前解答できてなかった内容です。

どのAIにも最初に質問していました。初めてChatGPT3.5を触った時に全く違う作者を答えたのでしばらくChatGPTを封印しました。その後GPT4を課金するまでしばらく時間がかかりました。

delayed diagnosis Paragonimiasis Japanに関する論文を検索してリンク先を提示して下さい。
さらにそれぞれの論文の要約を簡潔に示して下さい。

Plugins全体に言えることですが, 動作が不安定で処理のための待ち時間が発生します。質問してしばらく待ちます。ある程度の精度の解答が返ってきました。

追加質問で対話すること可能です。GPT4のため解答精度も高いです。

肺吸虫症は初期診断でどのような疾患と間違われますか? 誤診, mimicker

2.11.5 ChatGPT+ScholarAI

基本的に今まで挙げたAIと同じようなことができます。しかし, 現在 (2023/9) , 謎の利用中止となっています。

2.11.6 ChatGPT+Paperpile

最近リリースされたPluginsなのであまり使いこんでいませんが性能が高そうです。

delayed diagnosis Paragonimiasis Japanに関する論文を検索してリンク先を提示して下さい。
さらにそれぞれの論文の要約を簡潔に示して下さい。

関連性の高い論文を5つ, タイトル, 著者, 年, 要約, リンクとともに提示してくれました。

各論文から患者を抽出し, 比較表の作成をします。

各論文から5名の患者を抽出してください。5名の表を作成してください。表の内容は以下。
Author, Case (Age M or F), Symptoms, IgE, Imaging (CT所見), Time to diagnosis, 
misdiagnosed disease, tretment

これまで複数の手順を踏んで作成していた表が瞬時に作成できました。
また, 論文に関する質問の解答や論文どうしの比較考察もしてくれました。

2番の論文の症例と3番の症例を比較してください。なぜこの治療法が選ばれましたか。
詳細に記述してください。

総評：　一つ選ぶとなれば無料でトータル性能の高い Perplexity ではないでしょうか。将来性という意味ではいろいろカスタマイズができる ChatGPT+Paperpileに軍配があがります。動作が遅いなどβ版でいろいろ難点がありますが…

2.12 論文解析

自己研鑽の項と重複するところも多いかと思われますが、趣旨が少し異なるかなと思いましたので独立して説明します。例えば図表が多い論文はChatGPTのAdvanced Data Analysis (旧Code Interpreter) モードを使えば直接pdfなどを読み込み, グラフなどの作成が可能となり視覚的な把握が可能となります。

フリーの論文を適当にダウンロードしてChatGPTとともに学んでいきます。
今回の論文はCRP (C反応性タンパク質) の上昇がsepsis (敗血症) の診断に用いることが出来るのかというテーマらしいです。ちなみに解析, 要約, 何から何までGPTにしてもらいましたので筆者は全くこの論文を理解しないでこの記事を書いています。

※ 公式の正しい使い方は　⊕ Send a messageから自前のpdfを読み込ませて対話していくのですが全く使い物にならないので　テキストを直接copy and pasteします。

1. 患者の特性の分析:
男女比、年齢の範囲、平均年齢の分析をしてください。
これらのデータを視覚的に表現するためのヒストグラムや円グラフの使用してください。

2.SIRS（全身性炎症反応症候群）のマニフェストの分析:
Table 1を再構築してください。
Table 1に基づき、SIRSの各症状の頻度を比較してください。
どの症状が最も一般的で、どの症状が最も稀であるかの議論してください。

3. 臓器の機能不全の分析:
Table2を再構築してください。
Table 2を参照して、各臓器の機能不全の頻度を比較してください。
一般的に発生する臓器の機能不全と比較的まれな機能不全についての議論してください。

4. CRP（C-反応性蛋白）の値の分析:
CRPの頻度分布を視覚化するためのヒストグラムを作成してください。
CRPが120 mg/Lを超える場合の問題点や限界について議論してください。

これまでの4つの質問は筆者 (わたし) が考えたのではなくGPTにはじめに『どのような解析をすれば良いですか』と聞いて引き出したものです。
ただ単に『解析してください』だけなら薄い解析しかしません。

提供したdiscussion とこれまでの解析を総括してください。
Limitation　や足りないdata 今後の課題 どのような研究をすれば今回の研究の価値があがると
思いますか。

総括は論文の筆者とGPTの解析をまとめた総括です。という訳で論文のpdfを翻訳サイトで全訳して総括をそのまま自分の考えとしてまとめたら全自動で抄読会 (論文紹介) で発表できるかも?です。

2.12 英文 (和文) 翻訳, 校正

今でも忘れもしませんが初めて国際会議で発表したときの話です。当時, 翻訳ツールなど便利なものはなく (エキサイト翻訳がではじめたころで精度はかなり低かった記憶が), 英単語を自分で調べ教授に『この表現はどうですか?』など完全手動でプレゼンの準備をしていました。

今と比べると極めて非効率で発表当日までギリギリ準備し, もちろんセリフを完璧に覚えれる訳はなく心臓が破裂しそうな位に緊張していました。そこでカンペをノートPCのフタに隠してびくびくしながら発表しました。その直後に発表した年配の先生は全く緊張することなく堂々と紙を読み上げていました。次から適当でいいやという気持ちで救われました。

2.12.1 英文和訳
医師の和訳で最も重要なものは日々に読むべき英語論文の和訳ではないでしょうか。先ほど紹介したサイト, Perplexityなどは近未来完全な日本語対応 (全訳含め) しそうな気がします (有料課金させるためにもそれくらいはするのでは?)。

現時点で便利なツールとして, Deepl, ChatGPTが挙げられます。翻訳精度はいずれも大差ないと思いますが, 対話性能, 校正など総合的な性能を考慮しChatGPTに軍配が上がると思います。pdf論文をダイレクトに和訳するという意味ではDeepl翻訳に課金するか, Readableなどが選択肢に挙がります。

筆者はケチでせっかちのためChatGPT-4に論文の一部をコピペして要約しています。Perplexityなど, いろんなアプリケーションを開けるのが面倒くさいという理由だけですが…
方法としては1度に全て全訳するのは今の所難しく (上記の有料toolをつかわないと), PDF fileの訳したい部分をコピーし

GPTのChat欄に張り付けます。

GPT3.5は速度が速いのがメリットですがちょくちょく誤訳します。

和訳する時のコツは『一回の文は長すぎず, 短すぎず, 専門用語などはこちらがあらかじめ説明』することです。

医学論文翻訳のコツ

医学論文をGPTを使用して翻訳する際に、以下のポイントが重要である理由を説明いたします。
① 長すぎず短すぎず：
理由: GPTはコンテキストを元に回答や翻訳を生成するため、文章が長過ぎると重要な情報が欠落する恐れがあります。逆に、短すぎると文脈が不足し、不正確な翻訳が生じる可能性があります。適切な長さの文章を提供することで、正確で文脈に沿った翻訳を期待できます。
② 専門用語の明示：
理由: 医学分野には多くの専門用語が存在します。これらの用語は一般的な意味とは異なる場合があり、明確に指摘されないと、GPTが正確な翻訳を提供するのが困難になることがあります。そのため、特定の専門用語や業界用語を明示的に指摘することで、誤解を避け、適切な翻訳を得ることができます。
③ 文の背景を提供：
理由: 翻訳は単に言葉を別の言語に変換するだけではなく、その背景や状況に応じた意味の変換が必要とされます。特に医学論文のような専門的な文書では、文の背景や状況を正確に理解することが、正確な翻訳の鍵となります。文の背景や状況を提供することで、GPTはより文脈に応じた適切な翻訳を生成しやすくなります。

総合的に見ると、これらのポイントを考慮することで、GPTを使用して医学論文を翻訳する際の精度や適切性を向上させることができます。

また, 明らかに医学用語を使わない訳を返してきたときは 役割設定, 背景設定を文頭にいれてもいいかもしれません。

# あなたはプロの翻訳家です。
## 私は医師です。専門的な医学論文の翻訳をお願いします。

有料会員 ChatGPT plusの方はプラグインなどを用いる, GPT3.5の精度でよければChatPDF (Chat with any PDF) を利用することで英語論文のPDFをダイレクトに和訳, 要約することができます。

・Plugin : Ask YourPDFで和訳, 要約
PubMedからダウンロードした英語論文PDF (1MB 4ページ 2562文字) を日本語要約します。

7f0ce935-43a6-4f13-940b-847■■■■■■
上の文献 (Paragonimus westermani infection mimicking recurrent lung cancer) 
全体を参照し要約してください。

基本性能はChatGPT4に依存しますので, 読み取る文字数の上限は約4000トークン (2500文字程度) で, 要約性能などは非常に高いです。医学的, 専門的な質問の解答もしてくれます。

・ChatPDF ：Chat with any PDF (Web App)で和訳, 要約

こちらはサイト完結型でサイインなども不要です (だったはずです)。
まずは以下のサイトに行きます。

手持ちのPDFをサイト中央の四角にドラッグアンドドロップします。

一般的な分量の英語論文 (↓2500文字) の要約, 対話は問題なく行えます。

2.12.1 和文英訳 (英文翻訳)

日本語を英語にするプロセスはAIの大きな利点でChatGPTが普及した理由の一つと思います。英語→日本語への変換はuserが理解することが目的であり, 一方, 日本語→英語はそれに加えuserが使いたい (好む) 表現に変換するという一段階上のプロセスを含むと考えます。GPTなどのAIが登場する前はDeepl, Google翻訳でドラフト英訳してから

プロの翻訳家, 専門家, 専門のソフト (Grammarlyなど) で校正する必要がありました。

ChatGPTはこれらの作業を一度に行うことができ, さらに対話することで翻訳した英文の内容自体に関する質問や言い換え『他の表現法』を質問したり用途は非常に多いです。
医学的な文章を英語に翻訳するときの注意事項は下のとおりです。
校正すべきポイントとほぼ同義です。

① Grammar (文法)
・直訳の問題を避ける。
・冠詞、助詞の使用ミスを確認する。
・時制の誤用と前置詞の誤用を注意深くチェックする。

② Stylistic Concerns (スタイル的な問題)
・カジュアルな言葉の使用を避ける。
・抽象的な表現や長すぎる文を避ける。
・医学論文としての一貫したトーンを維持する。

③ Terminology and Context (専門用語と文脈)
・専門用語の誤用を確認する。
・文脈に合わない表現の使用を避ける。
・同じ専門用語に対する複数の翻訳を避ける。

④ Other Considerations (その他)
・文化的な背景や感受性を尊重する。
・患者, 筆者等のプライバシーや権利に関する情報を適切に取り扱う。
・論文全体での用語や表現の一貫性を確保する

上記は事前学習されておりプロンプトでこちらから説明する必要はありません。

まずは目標とする日本語訳をはじめに設定しておきます。

梨状筋症候群は、梨状筋が坐骨神経を圧迫または刺激することで生じる。坐骨神経は、腰椎と仙骨の間から伸び、臀部を通って足の裏に至る大きな神経で、その圧迫や刺激により痛みが生じる。診断は症状、身体所見、およびFauber's testに基づき行われる。MRIでは梨状筋の変化や坐骨神経周辺の炎症が確認されることがあるが、MRIで確定診断を行うことは困難である。梨状筋症候群の有病率は全体的に低いが、未診断の可能性もある。鑑別診断として、腰部椎間板ヘルニア、腰部脊柱管狭窄症、骨盤内の膿瘍などが考えられ、これらの疾患との区別が重要である。

文法的に誤りを含む雑な英語の文章を作成します。

Piriformis syndrome happen when piriformis muscle compresses or irritates sciatic nerve. The sciatic nerve stretches from lumbar to sacral, passing through buttocks, and ends up in bottom of foot, causing pain by its pressure or irritation. Diagnosis is based on interviews of symptoms, physical exam, and Faber test. On MRI, piriformis changes and inflammation around the sciatic nerve sometimes are confirmed, but obtaining a definitive diagnosis might be challenging.

雑なプロンプトでもまあまあの校正をしてくれます。

英文校正してください。

役割を定義する (あなたはプロの翻訳家です) などである程度の精度は上がりますがこれで十分なような気がします。あとは出力を少し見やすく, 例えば変更箇所はどこなのか太文字, 何行目か明らかにするプロンプトは便利かもしれません。

英文校正詳細プロンプト

英文を校正してください。全文を書き直す必要はなく, 変更後の全文を再表示する必要もありません。
変更案を提案して変更ポイントのみ提示してください。変更を太字 (変更前と変更後)にしてください。
変更した文は省略してはいけません。何行目か明示 例1行目→L1. 
また以下の観点からの改善点をについて日本語で解説してください。

2.14 おまけ　画像診断

ChatGPTは放射線の画像診断能力が高いことは以前から言われていました。

基本的にChatGPTに画像を読む能力はなく, Advanced Data Analysis (旧Code Interpreter) のOCR (高額文字認識) 機能もCTで病変を識別できるしろものではありません。

画像認識の研究がすすみGPTの診断能力を組み合わせるといずれ臨床で実践できるかもしれません。

3. まとめ

今回なんとなくで使ってたChatGPTを見直し全体像が把握できました。ChatGPTの得意分野は広いですが何でもできるわけではなく補助的な使い方がベストだと再認識しました。自分自身, reportやpresentationの資料を全て自動で作成出来ないかリリース当初から模索していましたが結局は出来ないという結論に至りました。(※無理やりプロンプトで自動化しましたが効率化という観点からそこまで便利ではないかと…)
しかし, 調べものや勉強会の資料作成などはGPTなしでは考えられないほど効率化に貢献しています。今回紹介出来ませんでしたが近日公開予定です。

3. AI 活用の落とし穴

ChatGPTがリリースされてから「こんなことが出来るのか!」→「ではこれもやってみよう!」→出来ない→ループ 期待と落胆の繰り返しでした。
一番初めにハマったのがグラフ作成でした。

出来ない→GPTに聞いてみる→GPT「このやり方はどうでしょう?」→やってみるが出来ない→ループ
ChatGPTはある意味優秀すぎて決して「出来ない」とは言いません。できなくても常に改善点, 代替案を提案してきます。しかも無限に。AIによって仕事が楽になるともいわれますが, むしろ増えるのではないかと思っています。リリース当時からほぼ毎日触ってアイデアを試していますが常に試す時間>やるべき項目となりcap上限 (3時間で25質問) に達しています。おそらく全て試す前に次の優秀なmodel (GPT5) が登場します。話をもどします

「できるできる詐欺」とは、AIやその他の技術の能力や可能性が過度に宣伝され、ユーザーがその能力を過度に期待する現象を指します。具体的には、AIが提示する提案やソリューションを試してみるものの、期待される結果が得られず、結果として時間やリソースが浪費されることが多い。これはAIの能力の過度な宣伝やユーザーの期待と現実のギャップ、そしてAIとの適切なコミュニケーションの不足などが原因となっています。この現象に陥ることで、ユーザーは失望感を感じることが多く、AIの有効性や信頼性に疑問を持つこともある。

要約すると, 出来そうで結局できない, 出来なくないが膨大な時間がかかる (グラフ作成はプロンプト作成に膨大な時間を費やした) ためにuserがAIに失望することです。
筆者もこれまでnoteで(将来)こんなことができますと大量に宣伝してしまったため出来る出来る詐欺に加担してしまいました orz…

出来る出来る詐欺具体例の一覧:
① 計算や組み合わせ問題: ユーザーが特定の数学的な計算や組み合わせ問題（例: シフト調整）をChatGPTに求める。初回の回答で目的の結果が得られないため、GPTはさらに具体的なプロンプトやアプローチを提案。ユーザーがその提案に基づいて再度試みるものの、結果が得られず、時間を浪費する。
② グラフ作成: ユーザーが特定のデータセットに基づくグラフの作成や解析をChatGPTに求める。GPTはテキストベースの回答しか提供できないため、具体的なグラフの形成は難しい。そのため、ユーザーにプロンプトや手順を提案し、それを試してもらう形になるが、最終的にはユーザーが手動でグラフを作成しなければならない場面が生じ、効率が損なわれる。
③ 高度なテキスト解析: 例えば、複雑な文献の要約や特定の情報の抽出をChatGPTに依頼する場合。GPTが初回の回答で要求に十分応えられなかった場合、さらに詳細なプロンプトや質問の修正を提案することがある。しかし、複数回の試みにも関わらず、期待する結果が得られない場合、ユーザーの時間が無駄になるリスクがある。
④ Code Interpreter (Advanced Data Analysis):
高性能のAIであるChatGPTに高度なデータ分析のコード解釈を求める。処理時間が非常に長く、膨大な時間を損失する可能性がある。その性能から期待する結果を得られる可能性が高く感じられるが、実際には難しい場合も。

4. なぜAIが普及しないか

GPTが登場したとき爆発的に普及するかと個人的に思いましたが実際は全く逆でした。

n=2500 の医者のうち「利用して有用な結果が得られた」割合はたったの

8.2%

らしいです。最大の理由の一つしてハルシネーションがあげられます。Google検索では有用な情報が上位にくるため検索して大嘘をつかれた経験はないと思います。またExcelで計算して, Excel「ちょっと計算間違いしました。」みたいなことがあれば2度とそのtoolを使いたくなくなるのが人間の心理ではないでしょうか。

普及が進まない理由として① AIは嘘をつくハルシネーション ② 個人情報, 情報流出 ③ 出来る出来る詐欺で落胆した　などいろいろあると思いますが

それらのデメリット以上の価値, potentialはあると思います。
個人的には効率化の観点から医療業界に普及して欲しいと考える一人です。

AIが普及しないこれらの理由をまとめて今回の記事を締めくくって下さい。