3달 전
워드 센스 디셈버이그레이션: 통합 평가 프레임워크와 실증적 비교
{Jose Camacho-Collados, ro, Roberto Navigli, Aless Raganato}

초록
단어의 의미 해석(Word Sense Disambiguation)은 자연어 처리 분야에서 오랫동안 연구되어 온 핵심 과제로, 인간의 언어 이해 능력의 핵심에 위치한다. 그러나 자동 시스템의 평가 방식은 신뢰할 수 있는 평가 프레임워크의 부재로 인해 여전히 문제를 안고 있다. 본 논문에서는 통합된 평가 프레임워크를 제안하고, 공정한 환경에서 다양한 단어의 의미 해석 시스템의 성능을 분석한다. 분석 결과, 지도 학습 기반 시스템이 지식 기반 모델보다 명확히 우수한 성능을 보였다. 특히 지도 학습 시스템 중에서도 전통적인 국소적 특징(feature)을 기반으로 선형 분류기를 학습한 모델이 여전히 높은 기준 성능을 유지하고 있음을 확인할 수 있었다. 그러나 최근에는 레이블이 없는 문장 집합(corpus)을 활용해 신경망 기반 접근법을 적용한 연구들이 놀라운 성과를 거두었으며, 대부분의 테스트 세트에서 이러한 기존의 강력한 기준 모델을 초월하는 결과를 보였다.