Calibration des questions et modélisation multi-sauts pour la réponse aux questions temporelles

De nombreux modèles exploitant les graphes de connaissances (KG) ont récemment démontré un succès remarquable dans les tâches de réponse aux questions (QA). Dans le monde réel, de nombreuses faits contenus dans les KG sont soumis à des contraintes temporelles, ce qui a conduit à une attention croissante portée à la question answering basée sur les graphes de connaissances temporels (temporal KGQA). Malgré les efforts fructueux des modèles précédents dans ce domaine, ceux-ci présentent encore plusieurs limites. (I) Ils utilisent des modèles linguistiques pré-entraînés (PLMs) pour extraire les représentations des questions, mais les PLMs ont tendance à se concentrer sur les informations d’entité tout en ignorant les transferts d’entités induits par les contraintes temporelles, ce qui empêche l’apprentissage de représentations temporelles spécifiques pour les entités. (II) Ils ne mettent pas suffisamment l’accent sur la structure du graphe entre les entités ni ne modélisent explicitement les relations multi-sauts dans le graphe, ce qui rend difficile la résolution de questions complexes à plusieurs sauts. Pour atténuer ces problèmes, nous proposons une nouvelle approche intitulée Question Calibration and Multi-Hop Modeling (QC-MHM). Plus précisément, nous calibrer d’abord la représentation de la question en fusionnant celle-ci avec les concepts contraints temporellement présents dans le KG. Ensuite, nous construisons une couche de réseau de neurones graphiques (GNN) afin de réaliser le passage de messages multi-sauts. Enfin, la représentation de la question est combinée avec l’embedding produit par le GNN pour générer la prédiction finale. Les résultats expérimentaux confirment que le modèle proposé obtient de meilleures performances que les modèles de pointe sur le jeu de données de référence. Notamment, les résultats de Hits@1 et Hits@10 de QC-MHM sur les questions complexes du jeu de données CronQuestions sont améliorés respectivement de 5,1 % et 1,2 % par rapport au meilleur modèle de référence. En outre, QC-MHM est capable de générer des prédictions interprétables et fiables.