3日前

医療グラフRAG:グラフ検索拡張生成による安全な医療大規模言語モデルへの道

Junde Wu, Jiayuan Zhu, Yunli Qi, Jingkun Chen, Min Xu, et al
医療グラフRAG:グラフ検索拡張生成による安全な医療大規模言語モデルへの道
要約

本稿では、医療分野に特化して設計された新しいグラフベースのリトリーブ・オーガナイズド・ジェネレーション(RAG)フレームワーク、すなわち MedGraphRAG を提案する。このフレームワークは、大規模言語モデル(LLM)が根拠に基づく医療応答を生成する能力を強化することを目的としており、個人の医療データを扱う際の安全性と信頼性の向上を図ることをめざしている。グラフベースのRAG(GraphRAG)は、LLMを活用してRAGデータをグラフ構造に整理することで、長文ドキュメントから包括的なインサイトを得る可能性を示している。しかし、従来のGraphRAGの実装は一般的な利用に適した複雑さを有しており、根拠に基づく応答の生成が困難であるため、医療分野における実効性に限界がある。この課題を克服し、GraphRAGの能力を医療分野に拡張するため、本研究では独自の「三重グラフ構築(Triple Graph Construction)」および「U-Retrieval」手法を提案する。グラフ構築の段階では、ユーザーのドキュメントを信頼性の高い医療情報源および制御語彙(controlled vocabularies)と連結する三重構造を構築する。リトリーブプロセスにおいては、上位から下位への精密検索(Top-down Precise Retrieval)と下位から上位への応答精緻化(Bottom-up Response Refinement)を統合した「U-Retrieval」を提案し、グローバルな文脈理解と正確なインデキシングのバランスを実現する。これらの技術により、信頼性の高い情報源の検索と包括的な応答生成が可能となる。本手法は、9つの医療QAベンチマーク、2つの健康事実検証ベンチマーク、および長文生成を評価するための自作データセットを用いて検証された。実験結果から、MedGraphRAGはすべてのベンチマークにおいて最先端モデルを一貫して上回る性能を示したほか、応答に信頼性のある情報源の引用および用語定義の付与を保証している。本研究のコードは以下のURLで公開されている: this https URL。

医療グラフRAG:グラフ検索拡張生成による安全な医療大規模言語モデルへの道 | 最新論文 | HyperAI超神経