MRAEA: 다국어 지식 그래프를 위한 효율적이고 강건한 엔티티 정합 접근법
다국어 지식 그래프(KG)에서 동치 엔티티를 탐색하는 엔티티 정합성(entity alignment)은 여러 지식 그래프를 자동으로 통합하는 데 핵심적인 역할을 한다. 기존의 번역 기반 엔티티 정합성 방법들은 다국어 지식과 단일 언어 지식을 하나의 통합 최적화 문제로 함께 모델링한다. 반면 그래프 신경망(GNN) 기반 방법들은 엔티티 노드 간의 차이를 무시하거나, 관계를 엔티티 또는 삼중항(triple) 인스턴스를 통해 표현한다. 이러한 방법들은 관계 내에 내재된 메타 의미(metasemantics)나 n대n 관계, 다중 그래프와 같은 복잡한 관계를 모델링하지 못한다. 이러한 과제를 해결하기 위해, 우리는 노드의 입력 및 출력 이웃과 연결된 관계의 메타 의미에 주목하여 다국어 엔티티 임베딩을 직접 모델링하는 새로운 메타 관계 인식 엔티티 정합성(Meta Relation Aware Entity Alignment, MRAEA)을 제안한다. 또한 학습 과정 중에 새로운 정합된 시드를 추가하기 위한 간단하면서도 효과적인 양방향 반복 전략을 제안한다. 모든 세 가지 벤치마크 엔티티 정합성 데이터셋에서의 실험 결과, 제안하는 방법은 기존 최고 성능 기법들을 일관되게 초월하며, Hit@1 지표에서 최대 15%~58%까지 성능 향상을 달성하였다. 광범위한 제거 실험(ablation study)을 통해 제안된 메타 관계 인식 표현, 관계 인식 자기 주목(self-attention), 그리고 새로운 시드 선택을 위한 양방향 반복 전략이 모두 성능 향상에 기여함을 입증하였다. 코드는 https://github.com/MaoXinn/MRAEA 에서 공개되어 있다.