12일 전

80%의 유리 천장 돌파하기: 지식 그래프 정보를 통합함으로써 단어의 의미 해석 정확도를 제고하기

{Michele Bevilacqua, Roberto Navigli}
80%의 유리 천장 돌파하기: 지식 그래프 정보를 통합함으로써 단어의 의미 해석 정확도를 제고하기
초록

신경망 아키텍처는 현재 단어의 의미 해석(Word Sense Disambiguation, WSD) 분야에서 최고의 성능을 보이는 기술이다. 그러나 이러한 아키텍처는 어휘 지식 기반(Lexical Knowledge Base, LKB)에 포함된 방대한 관계 정보를 제한적으로 활용하고 있다. 본 연구에서는 LKB 그래프 내의 정보를 신경망 아키텍처에 통합하여 지식의 풍부함을 효과적으로 활용하고, 미리 학습된 동의어 집합(thesaurus synset) 임베딩을 활용함으로써 훈련 데이터에 포함되지 않은 동의어 집합도 예측할 수 있는 신경망 기반의 지도 학습 아키텍처인 '강화된 동의어 집합 임베딩 및 관계 통합 WSD(EWISER)'를 제안한다. 그 결과, 고려된 거의 모든 평가 설정에서 새로운 최고 성능을 기록하였으며, 특히 기존의 표준 영어 전단어 WSD 평가 벤치마크들을 모두 결합한 경우 80%를 넘어서는 성능의 장벽을 처음으로 돌파하였다. 또한 다국어 전단어 WSD에 있어서는 영어 데이터만으로 학습함으로써 기존의 최고 성능을 초월하는 결과를 보였다.

80%의 유리 천장 돌파하기: 지식 그래프 정보를 통합함으로써 단어의 의미 해석 정확도를 제고하기 | 최신 연구 논문 | HyperAI초신경