TempoQR: 지식 그래프 위에서의 시공간 질문 추론

지식 그래프 질의 응답(KGQA)은 자연어 질의를 통해 지식 그래프(KG)에서 사실을 검색하는 작업을 의미한다. 지식 그래프는 실체(entity) 간 관계로 연결된 정제된 사실들의 집합이다. 일부 사실은 시간 정보를 포함하여 시계적 지식 그래프(Temporal KG, TKG)를 형성한다. 많은 자연어 질문은 명시적 또는 암시적인 시간 제약을 포함하지만, TKG 위에서의 질의 응답(QA)은 여전히 상대적으로 탐색이 부족한 영역이다. 기존의 접근 방식은 단일 TKG 사실로 직접 답변할 수 있는 단순한 시계적 질문에 주로 설계되어 있다. 본 논문은 TKG 위에서 복잡한 질문을 해결하기 위한 포괄적인 임베딩 기반 프레임워크를 제안한다. 제안하는 방법은 시계적 질문 추론(Temporal Question Reasoning, TempoQR)으로, TKG 임베딩을 활용하여 질문이 언급하는 특정 실체와 시간 범위에 질문을 정의한다. 이를 위해 세 가지 전용 모듈을 사용하여 질문 임베딩에 맥락, 실체, 시간 인식 정보를 보강한다. 첫 번째 모듈은 주어진 질문의 텍스트 표현을 생성하고, 두 번째 모듈은 질문에 등장하는 실체의 임베딩과 이를 결합하며, 세 번째 모듈은 질문에 특화된 시간 임베딩을 생성한다. 마지막으로, 트랜스포머 기반 인코더가 생성된 시계적 정보를 질문 표현과 융합하여 답변 예측에 활용한다. 광범위한 실험 결과는 TempoQR이 기존 최고 수준의 접근 방식 대비 복잡한 시계적 질문에서 정확도를 25~45퍼센트포인트 향상시키며, 미리 보지 못한 질문 유형에 대해 더 우수한 일반화 성능을 보임을 보여준다.