3일 전

의료 그래프 RAG: 그래프 검색 증강 생성을 통한 안전한 의료용 대규모 언어 모델 구현

Junde Wu, Jiayuan Zhu, Yunli Qi, Jingkun Chen, Min Xu, et al
의료 그래프 RAG: 그래프 검색 증강 생성을 통한 안전한 의료용 대규모 언어 모델 구현
초록

우리는 개인의 의료 데이터를 처리할 때 안전성과 신뢰성을 높이기 위해 증거 기반 의료 응답을 생성하는 데에 대규모 언어 모델(LLM)의 능력을 향상시키는 것을 목표로, 의료 분야에 특화된 새로운 그래프 기반 검색 증강 생성(RAG) 프레임워크인 MedGraphRAG을 제안한다. 그래프 기반 RAG(GraphRAG)는 LLM을 활용하여 RAG 데이터를 그래프 구조로 정리함으로써 장문 문서로부터 종합적인 통찰을 얻을 수 있는 잠재력을 지니고 있으나, 기존의 표준 구현 방식은 일반 사용에 너무 복잡하며, 증거 기반 응답 생성이 불가능하여 의료 분야에서의 효과성이 제한된다. 이러한 문제를 해결하기 위해, MedGraphRAG은 GraphRAG의 능력을 의료 분야에 확장하기 위해 고유한 삼중 그래프 구축(Triple Graph Construction) 및 U-검색(U-Retrieval) 기법을 제안한다. 본 연구에서 제안하는 그래프 구축 방식은 사용자 문서를 신뢰할 수 있는 의료 자료 및 통제된 용어집과 연결하는 삼중 연결 구조를 구성한다. 검색 과정에서는 상향식 응답 보완과 하향식 정밀 검색을 결합한 U-검색(U-Retrieval) 기법을 도입하여, 전반적인 맥락 인식 능력과 정밀한 색인화 간의 균형을 유지한다. 이러한 기법들은 원천 정보 검색과 종합적인 응답 생성을 동시에 가능하게 한다. 제안한 방법은 9개의 의료 Q&A 벤치마크, 2개의 건강 정보 검증 벤치마크, 그리고 장문 생성을 평가하기 위해 수집한 하나의 데이터셋에서 검증되었다. 실험 결과, MedGraphRAG는 모든 벤치마크에서 최신 기술(SOTA) 모델을 일관되게 능가하며, 응답에 신뢰할 수 있는 출처 문서 및 정의 포함 여부를 보장함으로써 신뢰성과 정확성을 동시에 확보하였다. 본 연구의 코드는 다음 URL에서 공개된다: this https URL.

의료 그래프 RAG: 그래프 검색 증강 생성을 통한 안전한 의료용 대규모 언어 모델 구현 | 최신 연구 논문 | HyperAI초신경