17일 전

시계열 질문 답변을 위한 질문 보정 및 다단계 모델링

Chao Xue, Di Liang, Pengfei Wang, Jing Zhang
시계열 질문 답변을 위한 질문 보정 및 다단계 모델링
초록

지식 그래프(KG)를 활용하는 많은 모델들이 최근 질문 응답(QA) 과제에서 놀라운 성과를 거두었다. 현실 세계에서 지식 그래프에 포함된 많은 사실들은 시간 제약 조건을 가지므로, 시간적 지식 그래프 기반 질문 응답(Temporal KGQA)에 대한 관심이 점점 커지고 있다. 이전 모델들이 시간적 KGQA 분야에서 풍부한 연구를 진행했음에도 불구하고, 여전히 몇 가지 한계를 가지고 있다. (I) 기존 모델들은 질문 표현을 얻기 위해 사전 훈련된 언어 모델(PLMs)을 사용하지만, PLMs는 엔티티 정보에 집중하는 경향이 있으며 시간 제약 조건에 의해 발생하는 엔티티의 이동을 간과하게 되어, 엔티티의 특정 시간적 표현을 학습하지 못한다. (II) 또한 엔티티 간의 그래프 구조를 강조하지 않으며, 그래프 내의 다중 훑기(multi-hop) 관계를 명시적으로 모델링하지 않아 복잡한 다중 훑기 질문 응답 문제 해결에 어려움을 겪는다. 이러한 문제를 완화하기 위해, 우리는 새로운 질문 보정 및 다중 훑기 모델링(Question Calibration and Multi-Hop Modeling, QC-MHM) 방법을 제안한다. 구체적으로, 먼저 지식 그래프 내의 시간 제약 개념과 질문을 융합하여 질문 표현을 보정한다. 그 후, 다중 훑기 메시지 전달을 수행하기 위해 GNN 레이어를 구축한다. 마지막으로, GNN의 출력 임베딩과 질문 표현을 결합하여 최종 예측을 생성한다. 실험 결과는 제안된 모델이 벤치마크 데이터셋에서 최신 기술(SOTA) 모델보다 우수한 성능을 달성함을 입증한다. 특히, CronQuestions 데이터셋의 복잡한 질문에 대해 QC-MHM의 Hits@1과 Hits@10 성능은 최고 성능을 기록한 기준 모델 대비 각각 5.1%, 1.2% 절대적으로 향상되었다. 더불어 QC-MHM은 해석 가능하고 신뢰할 수 있는 예측을 생성할 수 있다.