臨床AI、自信度で判断を調整
ワシントン大学セントルイス校のマッケルバイ工学部およびAIヘルス研究所の研究チームは、臨床用言語モデルの予測不確実性を最適化するCURA Clinical Uncertainty Risk Alignmentフレームワークを開発した。同成果は計算言語学会年次会議ACL 2026にて7月2日から7日にかけてサンディエゴで発表される予定であり、事前論文はarXivに公開済みだ。 医療AIは診断支援や予後予測において大きな可能性を秘める一方、誤予測に対する過信や不確実性の見積もり精度不足が実装の障壁となっている。特に医療AIと臨床医の協業においては、AIの誤りを盲目的に採用したり、逆に正しい予測を医師が却下したりする逆説的な結果が生じるケースが報告されている。本研究を主導する博士課程1年の王 Sizhe 氏は、モデルの確実性・不確実性見積もりを正確に較正することで、医療AIと臨床医の信頼できる協働基盤を構築する手法を提案した。 CURAは、医療言語モデルのリスク予測精度を維持しつつ、予測の不確実性パラメータを再調整する技術である。MIMIC IV重症患者データセットを用いて3つの事前学習済み臨床言語モデルをファインチューニングした後、予測の正解確率と不確実性の一致を図る較正プロセスを適用した。王氏は、モデルが正しい予測を行う際には自信を示させ、誤り可能性が高いケースでは不確実性を高めるよう設計したと説明する。 5つの臨床リスク予測タスクにおける評価実験では、CURAが全てのモデルで予測の較正精度を一貫して向上させたことが確認された。重要なのは、高リスクと低リスクの識別能力である分類性能の低下を伴わずに、信頼性の高い不確実性指標を実現した点である。従来のモデルはほぼゼロに近い不確実性を示し過信傾向にあったが、CURAはこれを抑制し、特に高リスクかつ困難な症例に対して適切な不確実性スコアを付与した。これにより、不確実性が低い予測は自動トリアージの安全なプールとして活用でき、不確実性が高い症例は医師による優先的なレビューに回すといった、医療ワークフローの最適化が期待できる。 研究チームは今後、CURAをより広範な患者集団へ拡張し、実際の医療現場における意思決定支援への実装効果を検証する方針だ。本技術は、医療AIの過信解消と臨床現場との協働効率化に寄与する可能性を秘めている。
