Raisonnement sur un graphe au niveau sémantique pour la vérification de faits

La vérification factuelle est une tâche difficile, car la validation de la vérité d’un énoncé nécessite une raisonnement fondé sur plusieurs éléments de preuve accessibles. Dans ce travail, nous proposons une méthode adaptée au raisonnement sur la structure sémantique des preuves. Contrairement à la plupart des travaux antérieurs, qui représentent généralement les phrases de preuve par concaténation de chaînes de caractères ou par fusion des caractéristiques de phrases isolées, notre approche opère sur des structures sémantiques riches extraites à partir de l’étiquetage des rôles sémantiques. Nous proposons deux mécanismes exploitant la structure des preuves tout en tirant parti des progrès réalisés par les modèles pré-entraînés tels que BERT, GPT ou XLNet. Plus précisément, en prenant XLNet comme base, nous utilisons d’abord la structure de graphe pour redéfinir les distances relatives entre les mots, sur la base de l’intuition selon laquelle les mots ayant une relation sémantique devraient être proches. Ensuite, nous appliquons un réseau de convolution de graphe (GCN) et un réseau d’attention de graphe (GAT) afin de propager et d’agréger l’information provenant des nœuds voisins dans le graphe. Nous évaluons notre système sur FEVER, un ensemble de données de référence pour la vérification factuelle, et constatons que les informations structurelles riches sont utiles, et que les deux mécanismes basés sur les graphes améliorent significativement la précision. Notre modèle représente actuellement l’état de l’art en termes de métriques d’évaluation officielles, à savoir la précision de vérification des affirmations et le score FEVER.