
초록
다자 대화 기반 기계 독해(Multi-party dialogue machine reading comprehension, MRC)는 대화 내 다수의 발화자들이 참여함에 따라 복잡한 발화자 정보 흐름과 노이즈가 많은 대화 맥락을 초래함으로써 큰 도전 과제를 안고 있다. 기존의 모델들은 이러한 문제를 완화하기 위해 복잡한 그래프 기반 모듈을 활용하거나 수동으로 레이블링된 추가 데이터를 도입하는 방식에 초점을 맞추었으나, 현실적인 시나리오에서는 이러한 레이블 데이터가 흔하지 않다. 본 논문에서는 발화자 및 핵심 발화에 대한 노동력이 필요 없는 자기지도 및 가상 자기지도 학습 예측 과제를 설계함으로써, 발화자 정보 흐름을 암묵적으로 모델링하고 긴 대화 내에서 중요한 단서를 효과적으로 포착하는 새로운 접근법을 제안한다. 두 개의 벤치마크 데이터셋에서 수행한 실험 결과는 제안한 방법이 경쟁 모델 및 현재 최고 성능 모델 대비 우수한 성능을 보임을 입증하였다.