17일 전

오픈도메인 질문 응답을 위한 밀도형 패스웨이 검색

Vladimir Karpukhin, Barlas Oğuz, Sewon Min, Patrick Lewis, Ledell Wu, Sergey Edunov, Danqi Chen, Wen-tau Yih
오픈도메인 질문 응답을 위한 밀도형 패스웨이 검색
초록

오픈도메인 질문 응답은 후보 문맥을 선택하기 위해 효율적인 문장 검색에 의존하며, 기존의 희소 벡터 공간 모델(예: TF-IDF 또는 BM25)이 사실상의 표준 방법이다. 본 연구에서는 단순한 이중 인코더(framework)를 통해 소수의 질문과 문장에서 임베딩을 학습함으로써 밀도 표현(dense representations)만을 사용하여 검색을 실질적으로 구현할 수 있음을 보여준다. 다양한 오픈도메인 QA 데이터셋에서 평가한 결과, 제안하는 밀도 기반 검색기(dense retriever)는 상위 20개 문장 검색 정확도에서 강력한 Lucene-BM25 시스템보다 절대적으로 9~19% 높은 성능을 기록하였으며, 엔드 투 엔드 QA 시스템이 여러 오픈도메인 QA 벤치마크에서 새로운 최고 성능(state-of-the-art)을 달성하는 데 기여하였다.

오픈도메인 질문 응답을 위한 밀도형 패스웨이 검색 | 최신 연구 논문 | HyperAI초신경