개요 작성 및 채우기: 지식 그래프에서 복잡한 질문에 답하기 위한 계층적 쿼리 그래프 생성

쿼리 그래프 구성의 목적은 자연어 질문에 답하기 위해 지식그래프(KG)에서 올바른 실행 가능한 SPARQL 쿼리를 생성하는 것입니다. 최근의 방법들은 신경망 기반 쿼리 그래프 순위 매기기를 사용하여 좋은 결과를 달성했지만, 더 복잡한 질문을 처리할 때 세 가지 새로운 도전 과제에 직면해 있습니다: 1) 복잡한 SPARQL 구문, 2) 막대한 검색 공간, 3) 국소적으로 모호한 쿼리 그래프입니다. 본 논문에서는 이러한 문제에 대한 새로운 해결책을 제시합니다. 이를 위해 각 SPARQL 절을 정점과 간선으로 구성된 하위 그래프로 취급하여 쿼리 그래프를 확장하고, 쿼리 그래프의 구조를 설명하기 위한 통합된 그래프 문법인 AQG(Autoregressive Query Graph)를 정의합니다. 이러한 개념들을 바탕으로, 우리는 계층적 자기회귀 디코딩을 수행하여 쿼리 그래프를 생성하는 새로운 엔드투엔드 모델을 제안합니다. 고수준 디코딩은 검색 공간을 줄이고 국소적으로 모호한 쿼리 그래프를 감소시키는 데 AQG를 제약 조건으로 사용합니다. 저수준 디코딩은 사전 준비된 후보들 중 적절한 인스턴스를 선택하여 AQG의 슬롯을 채워서 쿼리 그래프 구성 작업을 완료합니다. 실험 결과, 우리의 방법이 복잡한 지식그래프 질의응답 벤치마크에서 최고 수준의 성능(SOTA)을 크게 향상시켰음을 보여줍니다. 사전 학습된 모델들을 활용하면, 우리의 방법의 성능이 더욱 향상되어 사용된 세 개의 데이터셋 모두에서 최고 수준의 성능(SOTA)을 달성하였습니다.