
초록
개방형 도메인 질의 응답을 위한 생성형 모델은 외부 지식을 활용하지 않고도 경쟁력을 입증해왔다. 비록 유망한 방향이지만, 이 접근법은 수십억 개의 파라미터를 갖는 모델을 사용해야 하며, 이러한 모델은 학습과 질의 모두 비용이 매우 높다. 본 논문에서는 이러한 모델이 증거를 포함할 수 있는 텍스트 문단을 검색함으로써 얼마나 이점을 얻을 수 있는지 탐구한다. 우리는 자연 질문(Natural Questions) 및 트리비아QA(TriviaQA)와 같은 개방형 벤치마크에서 최신 기술 수준의 성능을 달성하였다. 흥미롭게도, 검색된 문단의 수를 늘릴수록 이 방법의 성능이 크게 향상되는 것을 관찰하였다. 이는 생성형 모델이 다수의 문단에서 제공되는 증거를 효과적으로 통합하고 조합할 수 있음을 시사한다.