GrapeQA : Amélioration de la Question-Réponse par une Augmentation et une Élagage de Graphe

Les méthodes de réponse aux questions basées sur le sens commun combinent la puissance des modèles linguistiques pré-entraînés (LM) avec le raisonnement fourni par les graphes de connaissances (KG). Une approche classique consiste à extraire des nœuds pertinents par rapport à une paire question-réponse à partir d’un KG afin de constituer un graphe de travail (WG), puis à effectuer un raisonnement à l’aide de réseaux neuronaux sur graphe (GNN). Cette approche soulève deux défis majeurs : (i) il est difficile de capturer l’ensemble de l’information contenue dans la paire question-réponse au sein du WG, et (ii) le WG inclut parfois des nœuds non pertinents provenant du KG. Pour surmonter ces limitations, nous proposons GrapeQA, une méthode fondée sur deux améliorations simples du WG : (i) la détection des entités marquantes pour l’augmentation du graphe identifie des extraits textuels pertinents issus de la paire question-réponse et enrichit le WG avec des représentations latentes correspondantes issues du LM ; (ii) une élagage de nœuds conscient du contexte élimine les nœuds moins pertinents par rapport à la paire question-réponse. Nous évaluons notre approche sur les jeux de données OpenBookQA, CommonsenseQA et MedQA-USMLE, et observons que GrapeQA apporte des améliorations constantes par rapport à son prédécesseur LM + KG (notamment QA-GNN), ainsi que des gains significatifs sur OpenBookQA.