17일 전
다중 스팬 질문에 대한 답변을 위한 간단하고 효과적인 모델
Elad Segal, Avia Efrat, Mor Shoham, Amir Globerson, Jonathan Berant

초록
독해 이해(Reading Comprehension, RC) 모델은 학습 문제를 완화하고 명시적인 텍스트 생성 모델이 필요하지 않도록 하기 위해 일반적으로 출력 공간을 입력 텍스트 내의 모든 단일 연속 스팬(subspan) 집합으로 제한한다. 그러나 답변을 단일 스팬으로 제한하는 것은 제약이 크며, 최근 일부 데이터셋에서는 다중 스팬 질문(multi-span questions)도 포함하고 있다. 즉, 답변이 텍스트 내에서 비연속적인 여러 스팬으로 구성되는 질문들을 의미한다. 자연스럽게 단일 스팬을 반환하는 기존 모델은 이러한 질문에 답할 수 없다. 본 연구에서는 이 문제를 시퀀스 태깅(sequence tagging) 문제로 재정의함으로써 다중 스팬 질문에 대한 간단한 아키텍처를 제안한다. 구체적으로, 입력 토큰 각각에 대해 해당 토큰이 출력에 포함되어야 하는지 여부를 예측하는 방식이다. 제안하는 모델은 DROP 및 Quoref 데이터셋에서 스팬 추출 질문에 대해 각각 9.9점, 5.5점의 EM(Exact Match) 성능 향상을 달성하여 현저한 성능 향상을 보였다.