2달 전
UnifiedQA: 단일 QA 시스템으로 형식 경계를 넘어서
Daniel Khashabi; Sewon Min; Tushar Khot; Ashish Sabharwal; Oyvind Tafjord; Peter Clark; Hannaneh Hajishirzi

초록
질의 응답(QA) 과제는 추출적 구간 선택, 다중 선택 등 다양한 형식을 사용하여 제시되었습니다. 이로 인해 형식에 특화된 모델들이 개발되었으며, 심지어 QA 커뮤니티 내에서 암묵적인 분할이 이루어졌습니다. 우리는 이러한 경계가 인위적이며 불필요할 수 있다고 주장합니다. 우리가 가르치려고 하는 추론 능력은 형식에 의해 결정되지 않기 때문입니다. 이를 증거로, 언어 모델링의 최신 발전을 활용하여 4개의 다양한 형식으로 구성된 17개의 QA 데이터셋에서 놀라운 성능을 보이는 단일 사전 학습 QA 모델인 UnifiedQA를 구축하였습니다. UnifiedQA는 각각의 데이터셋에서 개별적으로 훈련된 9개의 다른 모델들과 비슷한 성능을 보입니다. 또한, 관찰된 형식의 12개 미확인 데이터셋에서도 UnifiedQA는 놀라운 성능을 보여주며, 형식 외 훈련 데이터로부터 강한 일반화 능력을 나타냅니다. 마지막으로, 이 사전 학습 QA 모델을 단순히 세부 조정(fine-tuning)하여 특화된 모델로 변환하면 6개 데이터셋에서 새로운 최고 기준(state of the art)을 달성하며, UnifiedQA가 QA 시스템 구축을 위한 강력한 출발점임을 입증합니다.