지식 그래프를 위한 다중 차수 컨볼루션 네트워크 기반 엔티티 어라이어먼트
지식 그래프(KGs)는 실세계의 실체들 간의 관계와 속성을 모델링함으로써 이들을 통합하는 데 있어 널리 사용되는 구조로 부상했다. 서로 다른 지식 그래프 간의 대응 실체를 식별하는 엔티티 정합(entity alignment)은 학계와 산업계 모두에서 큰 주목을 받고 있다. 그러나 기존의 정합 기법들은 일반적으로 대량의 레이블 데이터를 필요로 하며, 다중 모달 데이터를 동시에 인코딩할 수 없고, 제한된 수의 일관성 제약 조건만을 강제한다. 본 논문에서는 다국어 지식 그래프에 대해 종단간(end-to-end), 비지도(unsupervised) 엔티티 정합 프레임워크를 제안한다. 이 모델은 다양한 정보 유형을 융합함으로써 지식 그래프 데이터의 풍부한 특성을 극대화한다. 관계 기반 상관관계를 다수의 차수(order)를 가진 그래프 컨볼루션 신경망(GCN) 모델을 활용하여 캡처함으로써 일관성 제약 조건을 만족시키고, 속성 기반 상관관계는 번역 기반 기계(translation machine)를 통해 통합한다. 모든 정보를 종합하기 위해 후기 융합(late-fusion) 메커니즘을 도입함으로써 각 접근 방식이 서로 보완되도록 하여 최종 정합 결과를 향상시키며, 일관성 위반에 대한 모델의 강건성도 향상시킨다. 실험 결과는 제안한 모델이 기존 벤치마크보다 정확도가 높고, 수 개의 주기 차수만큼 빠르게 동작함을 보여준다. 또한, 하이퍼파라미터에 대한 민감도, 레이블링 작업의 절감 효과, 그리고 악의적 조건에 대한 강건성도 실험적으로 입증하였다.