2달 전

개방형 도메인 질문 응답에서 답변 재순위화를 위한 증거 집합

Shuohang Wang; Mo Yu; Jing Jiang; Wei Zhang; Xiaoxiao Guo; Shiyu Chang; Zhiguo Wang; Tim Klinger; Gerald Tesauro; Murray Campbell
개방형 도메인 질문 응답에서 답변 재순위화를 위한 증거 집합
초록

최근 인기 있는 오픈 도메인 질문에 대한 답변 방법은 먼저 질문과 관련된 문단을 검색한 후, 읽기 이해 모델을 적용하여 답변을 추출하는 것입니다. 기존 방법들은 일반적으로 단일 문단에서 독립적으로 답변을 추출합니다. 그러나 일부 질문은 정확한 답변을 위해 다양한 출처에서 수집된 증거를 결합해야 합니다. 본 논문에서는 여러 문단을 활용하여 답변을 생성하는 두 가지 모델을 제안합니다. 이들 모델은 기존의 최신 질의응답(QA) 모델이 생성한 답변 후보들을 재정렬하는 답변 재순위 결정 방식을 사용합니다. 우리는 다른 문단에서 수집된 증거를 종합하여 답변을 더 잘 결정할 수 있도록, 강도 기반 재순위 결정(strength-based re-ranking)과 커버리지 기반 재순위 결정(coverage-based re-ranking)이라는 두 가지 방법을 제안합니다. 우리의 모델은 Quasar-T, SearchQA 및 TriviaQA의 오픈 도메인 버전 등 세 개의 공개 오픈 도메인 QA 데이터셋에서 최신 성능 결과를 달성하였으며, 앞서 언급된 두 데이터셋에서는 약 8% 포인트의 향상을 보였습니다.