17일 전
CorefQA: 코어퍼런스 해결을 질의 기반 스팬 예측으로서 접근하기
{Fei Wu, Fei Wang, Wei Wu, Jiwei Li, Arianna Yuan}

초록
본 논문에서는 공통 참조 해결(coreference resolution) 작업을 위한 정확하고 확장 가능한 접근법인 CorefQA를 제안한다. 우리는 문제를 질문 응답(QA) 방식과 유사하게, 구간 예측(span prediction) 문제로 재정의한다. 구체적으로, 각 후보 언급(candidate mention)에 대해 주변 맥락을 이용해 질의(query)를 생성하고, 생성된 질의를 기반으로 구간 예측 모듈을 활용하여 문서 내의 공통 참조에 해당하는 텍스트 구간을 추출한다. 이 방식은 다음과 같은 주요 장점을 지닌다: (1) 구간 예측 전략은 언급 제안 단계에서 누락된 언급들을 복구할 수 있는 유연성을 제공한다; (2) 질문 응답 프레임워크 내에서 언급과 그 맥락을 질의에 명시적으로 인코딩함으로써, 공통 참조 언급의 맥락에 내재된 다양한 단서들을 깊이 있고 체계적으로 분석할 수 있다; (3) 기존의 풍부한 질문 응답 데이터셋을 활용하여 데이터 증강(data augmentation)을 수행함으로써 모델의 일반화 능력을 향상시킬 수 있다. 실험 결과, 기존 모델 대비 상당한 성능 향상을 확인할 수 있었으며, CoNLL-2012 벤치마크에서 83.1(F1 점수, +3.5 상승), GAP 벤치마크에서 87.5(F1 점수, +2.5 상승)의 성능을 기록하였다.