17日前

MedMobile:専門家レベルの臨床能力を備えたモバイルサイズの言語モデル

Krithik Vishwanath, Jaden Stryker, Anton Alaykin, Daniel Alexander Alber, Eric Karl Oermann
MedMobile:専門家レベルの臨床能力を備えたモバイルサイズの言語モデル
要約

言語モデル(LM)は、医学分野において専門家レベルの推論能力および記憶能力を示している。しかし、計算コストの増大とプライバシーに関する懸念が、広範な実装を阻む主要な障壁となっている。本研究では、phi-3-miniの効率的な適応版として、38億パラメータの小型LM「MedMobile」を提案する。このモデルはモバイルデバイス上で動作可能であり、医療分野への応用に適している。実験の結果、MedMobileはMedQA(USMLE)テストにおいて75.7%のスコアを達成し、医師の合格基準(約60%)を上回り、サイズが100倍大きいモデルのスコアに迫る結果となった。さらに、詳細なアブレーション実験を実施した結果、チェーン・オブ・シンキング(CoT)、アンサンブル学習、ファインチューニングが性能向上に最も寄与することが示された一方で、予期せずリトリーブ・オーガナイズド・ジェネレーション(RAG)は有意な性能向上を示さなかった。

MedMobile:専門家レベルの臨床能力を備えたモバイルサイズの言語モデル | 最新論文 | HyperAI超神経