
초록
엔티티 링킹(Entity Linking, EL)과 단어의미해석(Word Sense Disambiguation, WSD)은 모두 언어의 어휘적 모호성을 다루는 작업이다. 그러나 두 작업은 매우 유사하게 보이지만 근본적인 차이가 있다. EL에서는 텍스트 내 언급(mention)을 명명된 엔티티(named entity)와 연결할 수 있으며, 해당 엔티티가 정확히 언급과 일치할 수도 있고 일치하지 않을 수도 있다. 반면 WSD에서는 단어 형태(또는 더 정확히는 어근, lemma)와 적절한 의미 해석 사이에 완벽한 일치가 존재한다. 본 논문에서는 후보 의미를 느슨하게 식별한 후, 밀도가 가장 높은 부분 그래프(densest subgraph) 히어리스틱을 활용하여 고일관성(semantically coherent) 의미 해석을 선정하는 그래프 기반의 통합적 접근법인 Babelfy를 제안한다. 실험 결과, 다양한 분야의 6개 데이터셋(다국어 환경 포함)에서 EL과 WSD 모두 최신 기술 수준의 성능을 달성하였다. Babelfy는 온라인 서비스로 제공되며, 웹사이트 http://babelfy.org 에서 이용 가능하다.