Raisonnement basé sur les graphes sur des connaissances externes hétérogènes pour la réponse aux questions du sens commun

La réponse aux questions nécessitant des connaissances courantes vise à répondre à des questions qui exigent des connaissances de fond non expressément mentionnées dans la question elle-même. Le défi majeur réside dans la manière d’extraire des preuves à partir de connaissances externes et de formuler des prédictions basées sur ces preuves. Les travaux récents consistent soit à apprendre à générer des preuves à partir de données annotées par des humains — une démarche coûteuse en termes de collecte —, soit à extraire des preuves à partir de bases de connaissances structurées ou non structurées, ce qui ne permet pas d’exploiter pleinement les avantages des deux types de sources. Dans ce travail, nous proposons d’extraire automatiquement des preuves à partir de sources hétérogènes de connaissances, et de répondre aux questions sur la base des preuves ainsi extraites. Plus précisément, nous extrayons des preuves à la fois à partir d’une base de connaissances structurée (ConceptNet) et de textes bruts de Wikipedia. Nous construisons des graphes pour chacune de ces deux sources afin d’obtenir leurs structures relationnelles. À partir de ces graphes, nous proposons une approche basée sur les graphes, composée d’un module d’apprentissage de représentations contextuelles de mots basé sur les graphes et d’un module d’inférence basé sur les graphes. Le premier module utilise les informations structurelles du graphe pour redéfinir la distance entre les mots, afin d’apprendre des représentations contextuelles de mots améliorées. Le second module emploie un réseau de convolution de graphe pour encoder les informations des voisins dans les représentations des nœuds, et agrège les preuves via un mécanisme d’attention sur les graphes afin de prédire la réponse finale. Les résultats expérimentaux sur le jeu de données CommonsenseQA montrent que notre approche basée sur les graphes, exploitant à la fois les deux sources de connaissances, améliore significativement les performances par rapport à des modèles de référence forts. Notre méthode atteint une précision de pointe (75,3 %) sur le classement CommonsenseQA, établissant ainsi un nouveau record.