
초록
시계열 지식 그래프(Temporal Knowledge Graphs, Temporal KGs)는 기존 지식 그래프에 각 간선에 대해 시작 및 종료 시각을 포함한 시계열 범위를 제공함으로써 확장된 형태이다. 지식 그래프 기반 질문 응답(KGQA)은 연구계에서 어느 정도 주목을 받아왔으나, 시계열 지식 그래프 기반 질문 응답(Temporal KGQA)은 여전히 비교적 탐색이 부족한 영역이다. 이 분야의 발전을 저해하는 또 다른 요인은 포괄적인 데이터셋의 부족이었다. 본 연구에서는 이러한 도전 과제를 해결하기 위해, 구조적 복잡도에 따라 명확히 분류된 버킷으로 구성된, 지금까지 알려진 가장 큰 Temporal KGQA 데이터셋인 CRONQUESTIONS를 제안한다. CRONQUESTIONS는 기존에 알려진 유일한 데이터셋보다 340배 규모로 확장되었다. 우리는 다양한 최첨단 KGQA 기법이 이 새로운 데이터셋에서 원하는 성능에 크게 미치지 못함을 발견했다. 이를 해결하기 위해, 최근 시계열 지식 그래프 임베딩 기술의 발전을 활용한 트랜스포머 기반의 CRONKGQA를 제안하며, 모든 기준선보다 뛰어난 성능을 달성했고, 가장 우수한 기존 방법 대비 정확도에서 120%의 향상을 이뤘다. 광범위한 실험을 통해 CRONKGQA의 작동 원리에 대한 심층적인 통찰을 제공하고, 향후 더 큰 성능 향상이 가능할 수 있는 상황들을 분석하였다. 데이터셋 외에도, 관련 코드를 공개하여 연구 공동체의 접근성을 높였다.