
초록
다국어 지식 그래프(이하 KG)인 DBpedia와 YAGO는 여러 개의 서로 다른 언어로 구성된 엔티티에 대한 구조화된 지식을 포함하며, 다국어 AI 및 자연어 처리(NLP) 응용 분야에서 유용한 자원으로 활용된다. 다국어 KG 정렬은 서로 다른 언어에서 동일한 의미를 가진 엔티티를 매칭하는 작업으로, 다국어 KG 내의 다국어 링크를 풍부하게 하는 중요한 방법이다. 본 논문에서는 그래프 컨볼루션 네트워크(GCN)를 활용한 새로운 다국어 KG 정렬 접근법을 제안한다. 사전에 정렬된 엔티티 집합을 기반으로, 제안하는 방법은 각 언어의 엔티티를 통합된 벡터 공간에 임베딩하도록 GCN을 학습시킨다. 학습된 임베딩 공간 내에서 엔티티 간의 거리 기반으로 엔티티 정렬을 탐지한다. 이 임베딩은 엔티티의 구조적 정보와 속성 정보 양쪽에서 학습이 가능하며, 구조적 임베딩과 속성 임베딩의 결과를 통합함으로써 정확한 정렬을 달성한다. 실제 다국어 KG 정렬에 대한 실험 결과, 기존의 임베딩 기반 KG 정렬 방법들과 비교하여 본 방법이 가장 우수한 성능을 보였다.