
초록
이전의 기계 이해(MC) 데이터셋들은 엔드투엔드 딥 러닝 모델을 훈련시키기에 너무 작거나, 현재의 MC 기술 능력을 평가하기에 충분히 어려운 경우가 많았습니다. 최근 발표된 SQuAD 데이터셋은 이러한 제한을 완화하고, 보다 현실적인 MC 모델 개발의 기회를 제공합니다. 이 데이터셋을 바탕으로 우리는 다중 관점 맥락 일치(Multi-Perspective Context Matching, MPCM) 모델을 제안합니다. 이 모델은 엔드투엔드 시스템으로, 본문에서 답변의 시작점과 종료점을 직접 예측합니다.우리의 모델은 먼저 질문과 비교하여 계산된 관련성 가중치를 곱해 본문의 각 단어 임베딩 벡터를 조정합니다. 그런 다음, 양방향 LSTM을 사용하여 질문과 가중치가 적용된 본문을 인코딩합니다. 본문의 각 지점에 대해, 우리의 모델은 인코딩된 질문과 여러 관점에서 맥락을 일치시키고 일치 벡터를 생성합니다. 이러한 일치 벡터들을 바탕으로, 우리는 또 다른 양방향 LSTM을 사용하여 모든 정보를 집계하고 시작점 및 종료점을 예측합니다.SQuAD 테스트 세트에서 수행한 실험 결과는 우리의 모델이 리더보드에서 경쟁력 있는 성능을 달성함을 보여줍니다.