2달 전
다중 증거 질문 응답을 위한 대립-세부 공동 주의망(Coarse-grain Fine-grain Coattention Network)
Victor Zhong; Caiming Xiong; Nitish Shirish Keskar; Richard Socher

초록
엔드투엔드 신경망 모델은 질문 응답 분야에서 상당한 진전을 이룩하였으나, 최근 연구들은 이러한 모델이 응답과 증거가 단일 문서 내에서 가까운 위치에 나타난다고 암시적으로 가정하고 있음을 보여주고 있다. 본 연구에서는 여러 문서에 걸친 증거 정보를 결합하는 새로운 질문 응답 모델인 Coarse-grain Fine-grain Coattention Network (CFC)를 제안한다. CFC는 쿼리와 관련하여 문서를 해석하고 적절한 답변을 찾는 코스그레인(Coarse-grain) 모듈과, 모든 문서에서의 출현 빈도를 쿼리와 비교하여 각 후보 답변의 점수를 매기는 파인그레인(Fine-grain) 모듈로 구성된다. 우리는 이러한 모듈들을 공동주의(coattention)와 자기주의(self-attention)의 계층 구조를 사용하여 설계하였다. 이 구조는 입력의 다양한 부분을 강조하도록 학습된다. Qangaroo WikiHop 다중 증거 질문 응답 과제에서 CFC는 사전 훈련된 문맥 인코더를 사용하지 않았음에도 불구하고, 사각 테스트 세트에서 70.6%의 새로운 최고 성능 결과를 달성하여 이전 최고 성능보다 3%의 정확도를 높였다.