2달 전
다중 문서 읽기 이해를 위한 깊은 캐스케이드 모델
Ming Yan; Jiangnan Xia; Chen Wu; Bin Bi; Zhongzhou Zhao; Ji Zhang; Luo Si; Rui Wang; Wei Wang; Haiqing Chen

초록
온라인 질문 응답 시스템을 설계할 때 효과성과 효율성 사이의 근본적인 절충안을 균형있게 유지해야 합니다. 효과성은 추출적 기계 독해 이해(Machine Reading Comprehension, MRC)와 같은 복잡한 기능에서 비롯되며, 효율성은 후보 문서 선택 및 문단 순위 결정과 같은 초기 검색 구성 요소의 개선을 통해 얻어집니다. 실제 세계의 다중 문서 MRC 시나리오의 복잡성을 고려할 때, 엔드 투 엔드 시스템에서 이 두 가지를 동시에 최적화하는 것은 어렵습니다. 이 문제를 해결하기 위해, 우리는 후보 텍스트의 문서 단위 및 문단 단위 순위 결정에서부터 기계 독해 이해를 활용한 보다 정확한 답변 추출로 점진적으로 발전하는 새로운 딥 캐스케이드 학습 모델을 개발하였습니다. 구체적으로, 효율성을 고려하여 간단한 함수를 사용하여 관련성이 없는 문서와 문단을 먼저 필터링합니다. 그런 다음 남아 있는 텍스트에 대해 더 나은 답변 추적을 위해 문서 추출, 문단 추출 및 답변 추출 세 모듈을 공동으로 학습시킵니다. 실험 결과는 제안된 방법이 두 개의 대규모 다중 문서 벤치마크 데이터셋인 TriviaQA와 DuReader에서 이전 최신 방법들을 능가함을 보여주었습니다. 또한, 우리의 온라인 시스템은 하루 수백만 건의 요청을 50밀리초 미만으로 안정적으로 처리할 수 있습니다.