
초록
최근 제안된 질문 응답(QA)을 위한 신경망 모델은 주로 본문과 질문 간의 관계를 포착하는 데 초점을 맞추고 있습니다. 그러나 이러한 모델들은 여러 문장에 분산되어 있는 관련 사실들을 연결하는 능력이 매우 제한적이어서, 다중 문장 추론, 공통 참조 해결 등의 깊은 이해를 달성하는 데 중요한 역할을 하지 못합니다. 또한 이러한 모델들은 질문 유형과 답변 유형에 명시적으로 집중하지 않는데, 이는 종종 QA에서 결정적인 역할을 합니다. 본 논문에서는 답변 추출을 위해 새로운 엔드투엔드(end-to-end) 질문 중심 다요소 주의 네트워크를 제안합니다. 텐서 기반 변환을 사용한 다요소 주의 인코딩은 관련 사실들이 여러 문장에 위치해 있더라도 의미 있는 사실들을 집약화합니다. 답변 유형을 암시적으로 추론하기 위해, 우리는 질문 내 중요한 단어들에 기반하여 질문 벡터를 인코딩하는 최대 주의 질문 집합 메커니즘(max-attentional question aggregation mechanism)도 제안합니다. 예측 과정에서는 첫 번째 wh-단어와 그 바로 다음 단어의 시퀀스 수준 인코딩을 추가적인 질문 유형 정보 출처로 통합합니다. 제안된 모델은 NewsQA, TriviaQA, SearchQA라는 세 개의 대규모 도전적인 QA 데이터셋에서 이전 최고 수준의 결과보다 크게 향상된 성능을 보입니다.