9일 전

개방형 도메인 질의 응답을 위한 생성 모델을 활용한 파스티지 검색

Gautier Izacard, Edouard Grave
개방형 도메인 질의 응답을 위한 생성 모델을 활용한 파스티지 검색
초록

개방형 도메인 질의 응답을 위한 생성형 모델은 외부 지식을 활용하지 않고도 경쟁력을 입증해왔다. 비록 유망한 방향이지만, 이 접근법은 수십억 개의 파라미터를 갖는 모델을 사용해야 하며, 이러한 모델은 학습과 질의 모두 비용이 매우 높다. 본 논문에서는 이러한 모델이 증거를 포함할 수 있는 텍스트 문단을 검색함으로써 얼마나 이점을 얻을 수 있는지 탐구한다. 우리는 자연 질문(Natural Questions) 및 트리비아QA(TriviaQA)와 같은 개방형 벤치마크에서 최신 기술 수준의 성능을 달성하였다. 흥미롭게도, 검색된 문단의 수를 늘릴수록 이 방법의 성능이 크게 향상되는 것을 관찰하였다. 이는 생성형 모델이 다수의 문단에서 제공되는 증거를 효과적으로 통합하고 조합할 수 있음을 시사한다.