2달 전

다중 문단 기계 독해 이해와 문단 간 답변 검증

Yizhong Wang; Kai Liu; Jing Liu; Wei He; Yajuan Lyu; Hua Wu; Sujian Li; Haifeng Wang
다중 문단 기계 독해 이해와 문단 간 답변 검증
초록

실제 웹 데이터에서의 기계 독해(Machine Reading Comprehension, MRC)는 일반적으로 검색 엔진이 검색한 여러 문단을 분석하여 질문에 답하는 것을 필요로 합니다. 단일 문단에 대한 MRC와 비교할 때, 다중 문단 MRC는 서로 다른 문단에서 여러 혼동 가능한 답변 후보를 얻을 가능성이 높기 때문에 더 어려운 문제입니다. 이 문제를 해결하기 위해, 우리는 각각의 내용 표현을 기반으로 서로 다른 문단에서 얻은 답변 후보들이 서로를 검증할 수 있도록 하는 엔드투엔드 신경망 모델을 제안합니다. 구체적으로, 우리는 세 가지 요소(답변 경계, 답변 내용, 그리고 문단 간 답변 검증)를 기반으로 최종 답변을 예측할 수 있는 세 개의 모듈을 공동으로 훈련시킵니다. 실험 결과, 제안된 방법이 베이스라인보다 크게 우수하며, 실제 환경을 대상으로 설계된 영어 MS-MARCO 데이터셋과 중국어 DuReader 데이터셋에서 최고 성능을 달성하였습니다.