17일 전
답변 전 단서: 생성 기반 다중 선택형 QA
Zixian Huang, Ao Wu, Jiaying Zhou, Yu Gu, Yue Zhao, Gong Cheng

초록
다중선택형 질문 답변(MCQA)의 주목받는 패러다임은 텍스트-텍스트 프레임워크를 활용하는 것이다. 다양한 작업의 데이터를 단일한 텍스트-텍스트 형식으로 통합함으로써, 강력하고 보편적인 생성형 인코더-디코더 모델을 훈련할 수 있다. 그러나 MCQA의 분류 성격에 맞추기 위해 생성 목표를 변형하는 과정에서 디코더의 활용도가 낮아지고, 디코더에서 추출할 수 있는 지식이 충분히 활용되지 않는 부작용이 발생한다. 본 논문에서는 사전 훈련된 인코더-디코더 모델의 생성 능력과 내재된 지식을 효과적으로 활용하기 위해, 생성 기반 개선 방식을 도입한 MCQA 모델인 GenMC를 제안한다. GenMC는 질문에서 힌트를 생성한 후, 해당 힌트를 활용해 MCQA를 위한 리더(reader)를 강화한다. 제안한 모델은 다양한 MCQA 데이터셋에서 기존의 텍스트-텍스트 모델들을 능가하는 성능을 보였다.