Command Palette
Search for a command to run...
Junnan Dong Siyu An Yifei Yu Qian-Wen Zhang Linhao Luo et al

초록
그래프 검색 증강 생성(GraphRAG)은 분산된 지식을 명시적인 구조화된 그래프로 정리함으로써 복잡한 추론 능력을 대규모 언어 모델에 효과적으로 향상시켜왔다. 기존의 연구들은 그래프 구축 또는 그래프 검색 중 하나에만 집중하여 개선을 시도해왔으나, 이는 도메인 전이가 발생할 경우 특히 성능이 제한적이었다. 본 논문에서는 전체 프레임워크를 복합적으로 통합하는 수직적 통합형 에이전트 패러다임인 Youtu-GraphRAG을 제안한다. 구체적으로, (i) 타깃 엔티티 유형, 관계 유형, 속성 유형에 따라 자동 추출 에이전트를 제한하는 시드 그래프 스키마를 도입하였으며, 미지의 도메인에 대한 확장성을 위해 지속적으로 확장 가능하도록 설계하였다; (ii) 스키마 기반으로 고차원 지식을 획득하기 위해, 구조적 토폴로지와 하위 그래프 의미 정보를 융합하는 새로운 이중 인지형 커뮤니티 탐지 기법을 개발하였다. 이를 통해 위계적인 지식 트리가 자연스럽게 형성되며, 커뮤니티 요약을 기반으로 상향식 추론과 하향식 필터링 모두를 지원한다; (iii) 동일한 그래프 스키마를 해석할 수 있도록 설계된 에이전트 기반 검색기(Agentic retriever)를 도입하여, 복잡한 질의를 처리 가능한 병렬 하위 질의로 변환한다. 이는 반복적인 반성(reflection)을 수행함으로써 보다 고도화된 추론을 가능하게 한다; (iv) 사전 훈련된 대규모 언어 모델(LM)에서 발생하는 지식 유출 문제를 완화하기 위해, 맞춤형 익명 데이터셋과 새로운 '익명성 복귀(Anonymity Reversion)' 태스크를 제안하였으며, 이는 GraphRAG 프레임워크의 실제 성능을 깊이 있게 측정할 수 있도록 한다. 여섯 가지 도전적인 벤치마크에서 실시한 광범위한 실험 결과는 Youtu-GraphRAG의 강력한 내구성을 입증하며, 최첨단 기준 대비 최대 90.71%의 토큰 비용 절감과 16.62% 높은 정확도를 달성함으로써 파레토 경계를 크게 전진시켰다. 이러한 결과는 본 연구의 뛰어난 적응성과, 스키마에 대한 최소한의 간섭으로도 원활한 도메인 전이가 가능함을 시사한다.