2달 전
신경망 QA를 가능한 한 간단하게 하지만 너무 단순화하지 않도록 만드는 방법
Dirk Weissenborn; Georg Wiese; Laura Seiffe

초록
최근 대규모 질문 응답(QA) 데이터셋의 개발은 QA를 위한 엔드투엔드 신경망 구조에 대한 상당한 연구를 촉발시켰습니다. 점점 복잡해지는 시스템들이 더 간단한 신경망 기반 시스템과의 비교 없이 설계되어 왔습니다. 이 연구에서는 추출형 QA 작업을 위한 신경망 기반 시스템 개발을 안내하는 간단한 휴리스틱을 제안합니다. 우리는 높은 성능을 가진 신경망 QA 시스템을 구축하기 위해 두 가지 요소가 필수적임을 발견했습니다: 첫째, 문맥 처리 과정에서 질문어에 대한 인식, 둘째, 단순한 단어 집합 모델링을 넘어서는 구성 함수, 예를 들어 순환 신경망입니다. 우리의 결과는 이러한 두 가지 요구 사항을 충족하는 FastQA 시스템이 기존 모델과 비교하여 매우 경쟁력 있는 성능을 달성할 수 있음을 보여줍니다. 우리는 이 놀라운 결과가 이전 시스템들의 성과와 최근의 QA 데이터셋의 복잡성을 재평가하게 한다고 주장합니다.