11일 전

공동 다국어 지식 그래프 완성 및 정렬

Vinh Tong, Dat Quoc Nguyen, Trung Thanh Huynh, Tam Thanh Nguyen, Quoc Viet Hung Nguyen, Mathias Niepert
공동 다국어 지식 그래프 완성 및 정렬
초록

지식 그래프(KG) 정렬과 완성은 일반적으로 두 개의 독립된 작업으로 간주된다. 최근 연구에서는 다수의 지식 그래프 간의 엔티티 및 관계 정렬, 예를 들어 공통 엔티티와 관계를 가진 다국어 지식 그래프 간의 정렬을 활용하고 있으나, 다국어 지식 그래프 완성(MKGC)이 다국어 지식 그래프 정렬(MKGA) 생성에 어떻게 기여할 수 있는지에 대한 깊이 있는 이해는 여전히 제한적이다. 구조적 불일치—MKGA 모델의 주요 과제—가 지식 그래프 완성 기법을 통해 완화될 수 있다는 관찰에 기반하여, 지식 그래프의 동시 완성과 정렬을 수행할 수 있는 새로운 모델을 제안한다. 제안하는 모델은 지식 그래프 완성과 정렬을 공동으로 수행하는 두 가지 구성 요소를 통합한다. 이 두 구성 요소는 다단계 이웃 구조를 엔티티 및 관계 표현에 인코딩하기 위해 제안하는 관계 인지형 그래프 신경망을 활용한다. 또한, (i) 완성 과정에서 얻은 정보를 정렬 구성 요소에 통합하여 구조적 불일치를 줄이는 메커니즘과, (ii) 정렬 시드를 확대하고 삼중항을 전이하는 메커니즘을 제안하여, 정렬 과정에서 정렬 시드의 양을 늘리고 삼중항을 효율적으로 전달한다. 공개된 다국어 기준 데이터셋을 활용한 광범위한 실험 결과, 제안 모델은 기존의 경쟁적 기준 모델들을 모두 상회하며, MKGC 및 MKGA 작업 모두에서 새로운 최고 성능(SOTA)을 달성하였다. 본 모델의 구현 코드는 공개적으로 GitHub(https://github.com/vinhsuhi/JMAC)를 통해 제공된다.