人間のような推論:新しいプロンプト戦略が医療 AI の精度向上
ベルリン工科大学の研究者チームは、大規模言語モデルに人間の直観と推論を模倣させることで、医療に関するアドバイス精度が飛躍的に向上することを発見しました。この研究は学術誌「JMIR Biomedical Engineering」に発表され、指示をコンピュータロジック中心から応用心理学に転換するプロンプトエンジニアリングのパラダイムシフトを提案しています。現在、数百万人のユーザーが ChatGPT などのツールを利用していますが、AI は過度な慎重さから軽微な症状に対しても緊急や専門医の受診を推奨する傾向があり、これが不必要な医療コストや患者の不安を引き起こす問題となっていました。研究を率いたマービン・コプカ氏とマルクス・A・フーフェル氏は、自然決定行動(NDM)と呼ばれる心理学の枠組みにインスパイアされたプロンプトを用いて、最新の GPT-4o を含む 10 種類の ChatGPT モデルをテストしました。NDM は不確実性が高 stakes の状況で人間がどのように意思決定を行うかに焦点を当てており、従来の論理的アプローチとは異なります。特に、AI が自ら初期の状況を「フレーム」として捉える際の過剰な慎重さを抑制するため、結果をシミュレーションさせたり自らの前提を問い直させたりする手法が効果的でした。コプカ氏は、現実世界の問題は情報が不完全で定義が曖昧な場合が多く、人間の専門家がそのような状況で意思決定するモデルを応用することが重要だと強調しています。この手法により、データが散漫で不完全なリアルワールドの状況では、計算ロジックよりも人間の認知に基づく推論藍図の方が効果的であることが示されました。今回の成果は LLM を臨床意思決定のパートナーとして有用化する上で重要な一歩ですが、研究チームは現在のモデルが制御された環境下で最も有効であるとし、標準化されていない日常環境でも通用するかについては今後の研究が必要だと指摘しています。これにより、医療データが整理されていない状況でも、より人間らしい判断を下す AI の実現に向けた道筋が示された形です。
