2달 전

신경 링크 예측기의 데이터 효율적인 복잡한 쿼리 응답을 위한 적응

Erik Arakelyan; Pasquale Minervini; Daniel Daza; Michael Cochez; Isabelle Augenstein
신경 링크 예측기의 데이터 효율적인 복잡한 쿼리 응답을 위한 적응
초록

불완전 지식 그래프에서 복잡한 쿼리를 처리하는 것은 모델이 결측 정보가 있는 상태에서 복잡한 논리적 쿼리를 답변해야 하는 어려운 작업입니다. 기존 연구에서는 이 문제를 해결하기 위해 복잡한 쿼리 답변 작업을 위해 엔드투엔드로 훈련된 아키텍처를 설계하였으며, 이 과정은 해석이 어려우며 많은 데이터와 자원을 필요로 합니다. 다른 연구 방향에서는 간단한 신경 링크 예측기를 재사용하여 복잡한 쿼리를 답변하는 방법을 제안하였습니다. 이는 훈련 데이터의 양을 수십 배 줄이는 동시에 해석 가능한 답변을 제공합니다. 그러나 이러한 접근 방식에서 사용되는 신경 링크 예측기는 명시적으로 복잡한 쿼리 답변 작업에 최적화되어 있지 않아, 그 점수들이 서로 상호작용하도록 교정되어 있지 않습니다.우리는 이러한 문제들을 CQD$^{\mathcal{A}}$를 통해 해결하고자 합니다. CQD$^{\mathcal{A}}$는 신경 링크 예측점수를 복잡한 쿼리 답변 작업에 맞게 재교정하기 위한 매개변수 효율적인 점수 \emph{적응} 모델입니다. 신경 링크 예측기는 동결된 상태인 반면, 적응 구성요소는 모델 매개변수의 수를 $0.03\%$만 증가시키면서 다운스트림 복잡한 쿼리 답변 작업에 대해 훈련됩니다. 또한, 교정 구성요소는 원자 부정(atomic negations)을 포함하는 쿼리에 대한 추론을 지원할 수 있게 하며, 이는 이전에는 링크 예측기로 불가능했던 것입니다.실험 결과, CQD$^{\mathcal{A}}$는 현재 최신 방법들보다 유의미하게 더 정확한 결과를 생성하며, 모든 데이터셋과 쿼리 유형 평균 Mean Reciprocal Rank (MRR) 값이 $34.4$에서 $35.1$로 개선되었습니다. 이는 사용 가능한 훈련 쿼리 유형의 $\leq 30\%$만 사용하면서 이루어진 결과입니다. 우리는 또한 CQD$^{\mathcal{A}}$가 데이터 효율적이며, 단지 $1\%$의 훈련 복잡한 쿼리만으로도 경쟁력 있는 성능을 달성하며, 도메인 외 평가에서도 견고함을 보임을 입증하였습니다.

신경 링크 예측기의 데이터 효율적인 복잡한 쿼리 응답을 위한 적응 | 최신 연구 논문 | HyperAI초신경