Raisonnement fondé sur les cas pour les requêtes en langage naturel sur les bases de connaissances

Il est souvent difficile de résoudre un problème complexe dès le départ, mais beaucoup plus facile si l’on peut accéder à d’autres problèmes similaires ainsi qu’à leurs solutions — un paradigme connu sous le nom de raisonnement fondé sur les cas (case-based reasoning, CBR). Nous proposons une approche neuro-symbolique de CBR (CBR-KBQA) pour la réponse aux questions sur de grandes bases de connaissances. CBR-KBQA repose sur une mémoire non paramétrique qui stocke des cas (questions et formes logiques) et sur un modèle paramétrique capable de générer une forme logique pour une nouvelle question en récupérant des cas pertinents. Sur plusieurs jeux de données KBQA contenant des questions complexes, CBR-KBQA atteint des performances compétitives. Par exemple, sur le jeu de données ComplexWebQuestions, CBR-KBQA dépasse l’état de l’art actuel de 11 % en précision. En outre, nous démontrons que CBR-KBQA est capable d’intégrer de nouveaux cas sans nécessiter d’entraînement supplémentaire : en incluant quelques exemples étiquetés manuellement dans la mémoire des cas, CBR-KBQA parvient à générer avec succès des formes logiques incluant des entités et des relations de la base de connaissances jamais rencontrées auparavant.