Vers des systèmes neuro-symboliques généralisables pour la réponse aux questions du sens commun

La question-réponse sur le sens commun non extractive reste une tâche difficile pour l’intelligence artificielle, car elle exige que les systèmes raisonnent, synthétisent et regroupent des éléments d’information dispersés afin de générer des réponses aux requêtes. Les approches récentes de ces tâches montrent une amélioration des performances, mais uniquement lorsque les modèles sont pré-entraînés avec des informations supplémentaires ou lorsqu’on utilise des heuristiques spécifiques au domaine, sans toutefois tenir compte de manière explicite du type de ressource de connaissance. Dans cet article, nous menons une revue des méthodes récentes de question-réponse sur le sens commun, et proposons une analyse systématique des ressources de connaissance couramment utilisées ainsi que des méthodes d’intégration de la connaissance, sur plusieurs benchmarks issus de diverses bases de données sur le sens commun. Nos résultats et notre analyse montrent que l’injection basée sur l’attention apparaît comme un choix préférable pour l’intégration de la connaissance, et que le degré de chevauchement entre les bases de connaissance et les jeux de données joue un rôle crucial dans la réussite des modèles.