
초록
모호한 대명사의 해석은 자연어 이해(Natural Language Understanding)에서 오랫동안 해결해야 하는 과제 중 하나입니다. 최근 연구에서는 최신 공통 참조 해석(coreference resolution) 시스템에 성별 편향이 존재함을 제시하였습니다. 예를 들어, 구글 AI 언어팀은 최근 성별 균형 잡힌 데이터셋을 발표하고, 이러한 공통 참조 해석기들의 성능이 해당 데이터셋에서 크게 제한됨을 보여주었습니다. 본 논문에서는 이 한계를 극복하고 데이터셋에서 성별 편향(0.99)이 현저히 낮아지는 추출형 질문 응답(QA) 방식의 대명사 해석 작업을 제안합니다. 이 시스템은 사전 학습된 BERT 모델에서 미세 조정된 표현을 사용하여, 수작업으로 설계된 특징 없이 기존 베이스라인보다 현저히 높은 성능(F1 점수에서 22.2% 절대적인 개선)을 보입니다. 이 QA 프레임워크는 대명사의 후보 선언항(antecedent)에 대한 지식 없이도 동등한 성능을 발휘합니다. QA와 BERT 기반 다중 선택 및 시퀀스 분류 모델들의 앙상블은 F1 점수를 더욱 개선(베이스라인 대비 23.3% 절대적인 개선)하였습니다. 이 앙상블 모델은 자연어 처리(Natural Language Processing)에서의 성별 편향 문제에 관한 1차 ACL 워크샵의 공유 작업에 제출되었습니다. 최종 공식 리더보드에서 9위를 차지했습니다. 소스 코드는 https://github.com/rakeshchada/corefqa 에서 확인할 수 있습니다.