지식 그래프에 논리적 쿼리를 임베딩하기

지식 그래프의 저차원 임베딩을 학습하는 것은 엔티티 간에 관찰되지 않거나 누락된 엣지를 예측하기 위한 강력한 접근 방식입니다. 그러나 이 분야에서 여전히 해결해야 할 문제는 단순한 엣지 예측을 넘어서 더 복잡한 논리적 쿼리를 처리할 수 있는 기술을 개발하는 것입니다. 이러한 쿼리는 여러 개의 관찰되지 않은 엣지, 엔티티, 변수를 포함할 수 있습니다. 예를 들어, 불완전한 생물학적 지식 그래프가 주어졌을 때, "질병 X와 Y 모두와 관련된 단백질을 대상으로 하는 가능성이 높은 약물은 무엇인가?"라는 쿼리를 예측하고 싶을 수 있습니다. 이 쿼리는 질병 X와 Y와 상호작용할 수 있는 모든 가능한 단백질에 대해 추론해야 하므로 복잡합니다.이 글에서는 불완전한 지식 그래프에서 제1차 논리의 유연하면서도 계산 가능한 부분 집합인 결합 논리적 쿼리(conjunctive logical queries)에 대한 예측을 효율적으로 수행하는 프레임워크를 소개합니다. 우리의 접근 방식은 그래프 노드를 저차원 공간에 임베딩하고, 논리 연산자를 이 임베딩 공간에서 학습된 기하학적 연산(예: 변환, 회전)으로 표현하는 것입니다. 저차원 임베딩 공간 내에서 논리 연산을 수행함으로써, 우리의 접근 방식은 쿼리 변수의 수에 선형적인 시간 복잡도를 가지며, 이를 반면 나이브 열거 기반 접근 방식은 지수적인 시간 복잡도가 필요합니다.우리는 이 프레임워크의 유용성을 두 가지 실제 데이터셋 연구에서 입증하였습니다. 각각 수백만 개의 관계를 포함하는 데이터셋으로, 약물-유전자-질병 상호작용 네트워크에서 논리적 관계를 예측하고, 인기 웹 포럼에서 파생된 사회적 상호작용의 그래프 기반 표현에서 논리적 관계를 예측하는 연구입니다.