12일 전
80%의 유리 천장 돌파하기: 지식 그래프 정보를 통합함으로써 단어의 의미 해석 정확도를 제고하기
{Michele Bevilacqua, Roberto Navigli}

초록
신경망 아키텍처는 현재 단어의 의미 해석(Word Sense Disambiguation, WSD) 분야에서 최고의 성능을 보이는 기술이다. 그러나 이러한 아키텍처는 어휘 지식 기반(Lexical Knowledge Base, LKB)에 포함된 방대한 관계 정보를 제한적으로 활용하고 있다. 본 연구에서는 LKB 그래프 내의 정보를 신경망 아키텍처에 통합하여 지식의 풍부함을 효과적으로 활용하고, 미리 학습된 동의어 집합(thesaurus synset) 임베딩을 활용함으로써 훈련 데이터에 포함되지 않은 동의어 집합도 예측할 수 있는 신경망 기반의 지도 학습 아키텍처인 '강화된 동의어 집합 임베딩 및 관계 통합 WSD(EWISER)'를 제안한다. 그 결과, 고려된 거의 모든 평가 설정에서 새로운 최고 성능을 기록하였으며, 특히 기존의 표준 영어 전단어 WSD 평가 벤치마크들을 모두 결합한 경우 80%를 넘어서는 성능의 장벽을 처음으로 돌파하였다. 또한 다국어 전단어 WSD에 있어서는 영어 데이터만으로 학습함으로써 기존의 최고 성능을 초월하는 결과를 보였다.