18일 전

ELDEN: 밀도화된 지식 그래프를 이용한 개선된 엔터티 링킹

{Priya Radhakrishnan, Vasudeva Varma, Partha Talukdar}
ELDEN: 밀도화된 지식 그래프를 이용한 개선된 엔터티 링킹
초록

엔티티 링킹(Entity Linking, EL) 시스템은 텍스트 내에서 언급된 엔티티를 지식 그래프(Knowledge Graph, KG) 상의 해당 엔티티로 자동 매핑하는 것을 목표로 한다. 지식 그래프 내에서 엔티티의 연결 밀도(connectedness)는 EL 시스템이 텍스트 내 언급을 KG의 엔티티에 올바르게 연결할 수 있는 능력에 직접적인 영향을 미친다. 이로 인해 많은 EL 시스템은 KG 내에서 다른 엔티티와 잘 연결된 엔티티에 대해 뛰어난 성능을 보이며, 결과적으로 지식 그래프의 밀도가 EL 성능에 미치는 영향이 부각된다. 본 논문에서는 밀도가 높은 지식 그래프를 활용한 엔티티 링킹 기법인 ELDEN(Entity Linking using Densified Knowledge Graphs)을 제안한다. ELDEN은 먼저 대규모 텍스트 코퍼스로부터의 공존 통계(co-occurrence statistics)를 활용해 지식 그래프를 밀도를 높이는 방식으로 확장한 후, 이를 기반으로 엔티티 임베딩을 학습한다. 학습된 엔티티 임베딩을 활용해 계산된 엔티티 유사도는 EL 성능을 향상시킨다. ELDEN은 기준 데이터셋에서 최신 EL 시스템을 모두 상회하는 성능을 보이며, 특히 지식 그래프 내에서 연결이 빈약한 엔티티에 대해서도 뛰어난 성능을 발휘한다. ELDEN의 접근법은 간단하면서도 효과적이며, 본 연구에서 제안한 코드와 데이터는 공개하여 연구 공동체의 활용을 지원한다.