17일 전

개방형 도메인 질의 응답을 위한 생성 증강 검색

Yuning Mao, Pengcheng He, Xiaodong Liu, Yelong Shen, Jianfeng Gao, Jiawei Han, Weizhu Chen
개방형 도메인 질의 응답을 위한 생성 증강 검색
초록

개방형 도메인 질문에 대한 답변을 위해 우리는 외부 자원을 활용하지 않고 휴리스틱적으로 탐색된 관련 맥락을 텍스트 생성을 통해 질의를 보강하는 Generation-Augmented Retrieval(GAR)을 제안한다. 본 연구에서는 생성된 맥락이 질의의 의미를 상당히 풍부하게 한다는 점을 입증하며, 희소 표현(BM25)을 사용한 GAR가 DPR과 같은 최신 밀도 기반 검색 방법과 비교해 유사하거나 더 뛰어난 성능을 달성함을 보여준다. 또한, 동일한 질의에 대해 다양한 맥락을 생성하는 것이 유익함을 입증하였으며, 이러한 결과들을 융합함으로써 일관되게 더 높은 검색 정확도를 얻을 수 있음을 확인하였다. 더불어 희소 표현과 밀도 표현은 종종 상호보완적인 관계이므로, GAR는 DPR과 쉽게 결합되어 더욱 뛰어난 성능을 발휘할 수 있다. 추출형 QA 설정에서 Natural Questions 및 TriviaQA 데이터셋에서 GAR는 추출형 리더를 갖추었을 때 최신 기술 수준의 성능을 달성하며, 동일한 생성형 리더를 사용할 경우 다른 검색 방법들보다 일관되게 우수한 성능을 보여준다.

개방형 도메인 질의 응답을 위한 생성 증강 검색 | 최신 연구 논문 | HyperAI초신경