2달 전
학습을 통한 반복적 스패너 표현 생성을 이용한 추출형 질문 응답
Kenton Lee; Shimi Salant; Tom Kwiatkowski; Ankur Parikh; Dipanjan Das; Jonathan Berant

초록
주어진 증거 문서에 대한 질문을 제시하는 독해 과제는 자연어 이해의 핵심적인 문제입니다. 최근 이 과제의 공식화는 일반적으로 수동으로 또는 외부 NLP 파이프라인을 사용하여 사전 정의된 후보 집합에서 답변을 선택하는 데 초점을 맞추었습니다. 그러나 Rajpurkar 등 (2016)은 제공된 텍스트에서 임의의 문자열이 답변이 될 수 있는 SQuAD 데이터셋을 최근 발표했습니다. 본 논문에서는 이러한 답변 추출 과제에 중점을 두고, 증거 문서 내 모든 구간의 고정 길이 표현을 효율적으로 구성하는 새로운 모델 아키텍처를 제시합니다. 우리는 명시적인 구간 표현을 점수화하는 것이 단어나 시작 및 종료 마커에 대한 별도의 예측으로 예측을 분리하는 다른 접근 방식보다 성능이 크게 향상됨을 보여줍니다. 우리의 접근 방식은 Wang & Jiang (2016)의 최고 기록 결과를 5% 개선하고, Rajpurkar 등이 제안한 베이스라인 오류를 50% 이상 감소시킵니다.