GRAIL: 검색 증강 추론을 위한 대규모 지식 그래프와 상호작용하는 법 학습하기

구조화되지 않은 데이터 위주로 작동하는 기존의 검색 증강 생성(RAG) 기법은 다양한 분야에서 뛰어난 성능을 보여왔지만, 지식 그래프와 같은 구조화된 지식을 효과적으로 처리하지 못하는 한계를 가지고 있다. 한편, 현재의 그래프 검색 방법은 전체적인 그래프 구조를 충분히 포착하지 못할 뿐만 아니라, 핵심 정보 누락 또는 과도한 중복 연결 등 정밀도 제어 문제를 동반하며, 이는 종합적인 추론 성능을 저해한다. 이러한 문제를 해결하기 위해 우리는 GRAIL(Graph-Retrieval Augmented Interactive Learning)을 제안한다. GRAIL은 대규모 그래프와 상호작용하여 검색 증강 추론을 수행할 수 있도록 설계된 프레임워크이다. 구체적으로, GRAIL은 LLM(대규모 언어 모델)을 기반으로 한 무작위 탐색과 경로 필터링을 결합하여 데이터 합성 파이프라인을 구축하며, 각 작업에 대해 세밀한 추론 경로를 자동으로 생성한다. 합성된 데이터를 기반으로, 우리는 추론 단계별로 최적의 행동을 동적으로 결정할 수 있는 정책을 학습하기 위해 이단계 학습 과정을 도입한다. 그래프 검색에서 정밀도와 간결성의 균형을 달성하는 종합적인 목표는 세밀한 과정 감독 보상으로 분해되어, 데이터 효율성과 학습 안정성이 향상된다. 실질적인 배포 환경에서는 GRAIL이 상호작용형 검색 패러다임을 채택하여 모델이 그래프 경로를 자율적으로 탐색하면서 검색의 폭과 정밀도 사이를 동적으로 균형 잡을 수 있도록 한다. 광범위한 실험 결과, GRAIL은 세 가지 지식 그래프 기반 질문-응답 데이터셋에서 평균 정확도 21.01% 향상과 F1 점수 22.43% 향상을 달성하였다. 본 연구의 소스 코드 및 데이터셋은 다음 URL에서 공개되어 있다.