11일 전
SAFRAN: 임베딩 모델을 능가하는 해석 가능하고 규칙 기반의 링크 예측 방법
Simon Ott, Christian Meilicke, Matthias Samwald

초록
지식 그래프 내 새로운 링크를 예측하기 위한 신경 임베딩 기반 기계학습 모델은 그 가능성에 대해 주목받고 있으나, 해석 가능성의 부족으로 인해 실용성에 한계가 있다. 최근, 완전히 해석 가능한 규칙 기반 알고리즘인 AnyBURL이 여러 일반 목적의 링크 예측 벤치마크에서 매우 경쟁력 있는 성과를 보였다. 그러나 현재의 다수 규칙 예측을 집계하는 접근 방식은 중복 규칙으로 인해 영향을 받는다는 문제가 있다. 본 연구에서는 이러한 문제를 해결하기 위해 새로운 집계 방식인 '비중복 노이즈 OR(Non-redundant Noisy-OR)'를 도입한 SAFRAN 규칙 적용 프레임워크를 제안한다. 이 프레임워크는 집계 전에 중복 규칙을 탐지하고 군집화함으로써 중복성을 효과적으로 제거한다. SAFRAN은 기존의 일반 목적 벤치마크인 FB15K-237, WN18RR, YAGO3-10에서 완전히 해석 가능한 링크 예측 분야에서 새로운 최고 성능을 달성하였다. 또한 FB15K-237 및 WN18RR에서는 여러 전통적인 임베딩 기반 알고리즘의 성능을 초과하며, YAGO3-10에서는 규칙 기반과 임베딩 기반 알고리즘 간의 성능 격차를 좁히는 데 기여하였다.