HyperAIHyperAI
il y a 14 jours

Réponse à des questions à plusieurs étapes par chaînes de raisonnement

Jifan Chen, Shih-ting Lin, Greg Durrett
Réponse à des questions à plusieurs étapes par chaînes de raisonnement
Résumé

La réponse à des questions à plusieurs sauts exige que les modèles collectent des informations provenant de différentes parties d’un texte afin de répondre à une question. La plupart des approches actuelles abordent cette tâche de manière end-to-end à l’aide de réseaux neuronaux, sans maintenir de représentation explicite du processus de raisonnement. Nous proposons une méthode permettant d’extraire une chaîne de raisonnement discrète à partir du texte, composée d’une série de phrases menant à la réponse. Nous alimentons ensuite ces chaînes extraites dans un modèle de réponse à questions basé sur BERT pour effectuer la prédiction finale de la réponse. De manière cruciale, nous ne nous appuyons ni sur des chaînes annotées comme or, ni sur des « faits soutiens » lors de l’entraînement : au lieu de cela, nous générons des chaînes de raisonnement pseudo-or (pseudogold) à l’aide d’heuristiques fondées sur la reconnaissance d’entités nommées et la résolution de coreférences. De plus, nous ne faisons pas appel à ces annotations au moment du test, car notre modèle apprend à extraire les chaînes directement à partir de textes bruts. Nous évaluons notre approche sur deux grands jeux de données récents de questions à plusieurs sauts : WikiHop et HotpotQA, et obtenons des performances de pointe sur WikiHop ainsi qu’une performance remarquable sur HotpotQA. Une analyse détaillée révèle les propriétés des chaînes essentielles à une haute performance : en particulier, le traitement séquentiel de l’extraction est crucial, tout comme la prise en compte de chaque phrase candidate de manière contextuelle. En outre, une évaluation humaine montre que les chaînes extraites permettent aux humains de donner des réponses avec une grande confiance, indiquant que ces chaînes constituent une abstraction intermédiaire puissante pour cette tâche.

Réponse à des questions à plusieurs étapes par chaînes de raisonnement | Articles de recherche récents | HyperAI