11日前
BiomedGPT:多様な生物医学タスク向けの汎用視覚言語基盤モデル
Kai Zhang, Rong Zhou, Eashan Adhikarla, Zhiling Yan, Yixin Liu, Jun Yu, Zhengliang Liu, Xun Chen, Brian D. Davison, Hui Ren, Jing Huang, Chen Chen, Yuyin Zhou, Sunyang Fu, Wei Liu, Tianming Liu, Xiang Li, Yong Chen, Lifang He, James Zou, Quanzheng Li, Hongfang Liu, Lichao Sun

要約
従来のバイオメディカル人工知能(AI)モデルは、特定のタスクやデータモダリティに特化して設計されているため、実際の臨床現場における展開において柔軟性に欠け、包括的な情報を有効に活用できない傾向がある。一方、汎用型AIは、異なるデータタイプの解釈が可能であり、多様なニーズに応じたカスタマイズされた出力を生成できるという利点から、こうした課題の解決に有望である。しかし、現在のバイオメディカル分野における汎用型AIソリューションは、一般的にモデルが重く、研究者・臨床現場の実務家・患者にとって閉鎖的でアクセスが困難な状況にあり、実用性に課題を抱えている。本研究では、初めてオープンソースかつ軽量型の視覚言語基盤モデルとして、多様なバイオメディカルタスクを実行可能な汎用型モデル「BiomedGPT」を提案する。BiomedGPTは、25件の実験のうち16件で最先端の性能を達成しつつ、計算リソースに優しいモデルサイズを維持した。さらに、放射線学における視覚的質問応答(VQA)、レポート生成、要約作成の3つのタスクについて、人間による評価を実施した結果、質問応答では3.8%という低誤差率で堅牢な予測能力を示し、複雑な放射線学的レポート作成においては8.3%の誤差率で満足のいく性能を発揮し、要約能力においても人間専門家とほぼ同等の好まれる度合い(preference score)を示した。本研究の結果は、多様なデータを用いた有効な学習が、診断精度の向上および臨床ワークフローの効率化を実現する実用的なバイオメディカルAIの開発につながることを示している。