11일 전
엔티티 앨라이어먼트에서 음성 샘플이 필요한가? 높은 성능, 확장성 및 강건성을 갖춘 접근법
Xin Mao, Wenting Wang, Yuanbin Wu, Man Lan

초록
엔티티 정렬(Entity Alignment, EA)은 서로 다른 지식 그래프(KG) 간에 동일한 엔티티를 식별하는 것을 목표로 하며, 다수의 지식 그래프를 통합하는 데 있어 핵심적인 단계이다. 그러나 기존의 대부분의 EA 방법은 높은 확장성 문제를 가지고 있어 대규모 데이터셋에 대응하기 어려운 실정이다. 기존 EA 방법의 높은 시간-공간 복잡도를 초래하는 세 가지 주요 문제를 요약하면 다음과 같다: (1) 비효율적인 그래프 인코더, (2) 음성 샘플링의 딜레마, (3) 반감독 학습에서의 ‘재앙적 망각(Catastrophic forgetting)’ 현상이다. 이러한 문제를 해결하기 위해, 높은 성능, 높은 확장성, 높은 내구성(Performance, Scalability, Robustness, PSR)을 갖춘 새로운 EA 방법을 제안하며, 이를 실현하기 위해 세 가지 새로운 구성 요소를 도입한다: (1) 관계형 그래프 샘플링을 적용한 단순화된 그래프 인코더, (2) 대칭적이고 음성 샘플링이 필요 없는 정렬 손실 함수, (3) 증분형 반감독 학습 기법. 또한, 여러 공개 데이터셋을 대상으로 철저한 실험을 수행하여 제안한 방법의 효과성과 효율성을 검증하였다. 실험 결과, PSR는 기존 최고 성능(SOTA)을 초월하는 성능을 보였을 뿐 아니라, 뛰어난 확장성과 내구성도 동시에 확보함을 확인하였다.