Command Palette
Search for a command to run...
BiomedGPT:多様な生物医学タスク向けの汎用視覚言語基盤モデル
BiomedGPT:多様な生物医学タスク向けの汎用視覚言語基盤モデル
概要
従来のバイオメディカル人工知能(AI)モデルは、特定のタスクやデータモダリティに特化して設計されているため、実際の臨床現場における展開において柔軟性に欠け、包括的な情報を有効に活用できない傾向がある。一方、汎用型AIは、異なるデータタイプの解釈が可能であり、多様なニーズに応じたカスタマイズされた出力を生成できるという利点から、こうした課題の解決に有望である。しかし、現在のバイオメディカル分野における汎用型AIソリューションは、一般的にモデルが重く、研究者・臨床現場の実務家・患者にとって閉鎖的でアクセスが困難な状況にあり、実用性に課題を抱えている。本研究では、初めてオープンソースかつ軽量型の視覚言語基盤モデルとして、多様なバイオメディカルタスクを実行可能な汎用型モデル「BiomedGPT」を提案する。BiomedGPTは、25件の実験のうち16件で最先端の性能を達成しつつ、計算リソースに優しいモデルサイズを維持した。さらに、放射線学における視覚的質問応答(VQA)、レポート生成、要約作成の3つのタスクについて、人間による評価を実施した結果、質問応答では3.8%という低誤差率で堅牢な予測能力を示し、複雑な放射線学的レポート作成においては8.3%の誤差率で満足のいく性能を発揮し、要約能力においても人間専門家とほぼ同等の好まれる度合い(preference score)を示した。本研究の結果は、多様なデータを用いた有効な学習が、診断精度の向上および臨床ワークフローの効率化を実現する実用的なバイオメディカルAIの開発につながることを示している。