Arbre de décomposition de question pour répondre à des questions complexes sur des bases de connaissances

La question-réponse basée sur une base de connaissances (KBQA) a suscité un intérêt croissant ces dernières années, en particulier pour les questions complexes nécessitant plusieurs faits pour être résolues. La décomposition des questions constitue une approche prometteuse pour répondre à de telles questions. Toutefois, les méthodes de décomposition existantes divisent la question en sous-questions selon un seul type de compositionnalité, ce qui s'avère insuffisant pour les questions impliquant plusieurs types de compositionnalité. Dans cet article, nous proposons le modèle Question Decomposition Tree (QDT) pour représenter la structure des questions complexes. Inspirés par les avancées récentes en génération de langage naturel (NLG), nous introduisons une méthode en deux étapes appelée Clue-Decipher, capable de générer des QDT. Cette méthode exploite la puissante capacité des modèles NLG tout en préservant intégralement les questions d'origine. Pour vérifier que le QDT améliore effectivement la performance du système KBQA, nous avons conçu un système KBQA fondé sur la décomposition, nommé QDTQA. Des expérimentations étendues montrent que QDTQA dépasse les méthodes les plus avancées précédentes sur le jeu de données ComplexWebQuestions. En outre, notre méthode de décomposition améliore un système KBQA existant de 12 % et établit un nouveau record sur LC-QuAD 1.0.