16일 전
다국어 지식 그래프 완성에 대한 앙상블 지식 전이
Xuelu Chen, Muhao Chen, Changjun Fan, Ankith Uppunda, Yizhou Sun, Carlo Zaniolo

초록
지식 그래프(KG)에서 누락된 사실을 예측하는 것은 지식 기반 구축과 추론에서 핵심적인 과제이며, 최근에는 KG 임베딩 기법을 활용한 연구가 활발히 진행되고 있다. 기존의 KG 임베딩 접근법은 주로 단일 KG 내에서 사실을 학습하고 예측하는 데 집중하지만, 다양한 언어별 KG들은 각각 데이터 품질과 커버리지 측면에서 고유한 강점과 한계를 지니고 있기 때문에, 다수의 언어별 KG에 포함된 지식을 활용하는 것이 더 현실적인 해결책이 될 수 있다. 그러나 이러한 다중 KG 간 지식 전이 과정은 보통 정합성 정보의 부족과 서술된 사실의 불일치로 인해 상당한 도전 과제가 된다. 본 논문에서는 다수의 언어별 KG 간 임베딩 학습과 앙상블 지식 전이를 위한 새로운 프레임워크인 KEnS를 제안한다. KEnS는 모든 KG를 공유 임베딩 공간에 매핑하여, 자기학습 기반으로 실체 간의 관계를 포착한다. 이후 KEnS는 다수의 언어별 KG 임베딩에서 도출된 예측 결과를 앙상블 추론을 통해 통합하며, 다양한 앙상블 기법을 탐색한다. 5개의 실세계 언어별 KG에 대한 실험 결과, KEnS는 보완적인 지식을 효과적으로 식별하고 활용함으로써, KG 완성(KG completion) 작업에서 기존 최고 수준의 방법들을 일관되게 개선함을 보였다.