HyperAIHyperAI
il y a 17 jours

Répondre à des questions complexes dans un domaine ouvert par génération itérative de requêtes

Peng Qi, Xiaowen Lin, Leo Mehr, Zijian Wang, Christopher D. Manning
Répondre à des questions complexes dans un domaine ouvert par génération itérative de requêtes
Résumé

Il est difficile pour les systèmes actuels de réponse à des questions (QA) à étape unique, consistant à récupérer puis lire, de répondre à des questions telles que « Quel roman de l’auteur d’« Armada » sera adapté en film de long métrage par Steven Spielberg ? », car cette question contient rarement des indices récupérables concernant l’entité manquante (ici, l’auteur). Pour répondre à une telle question, il est nécessaire de procéder à un raisonnement à plusieurs étapes, en rassemblant d’abord des informations sur l’entité manquante (ou des faits) afin de poursuivre le raisonnement. Nous présentons GoldEn (Gold Entity) Retriever, un système qui itère entre lecture du contexte et récupération de documents supplémentaires pour répondre à des questions ouvertes à plusieurs étapes. Contrairement aux modèles de récupération neurale opaques et coûteux en ressources computationnelles, GoldEn Retriever génère des requêtes de recherche en langage naturel à partir de la question et du contexte disponible, puis exploite des systèmes de récupération d’information standards pour localiser les entités manquantes. Cette approche permet à GoldEn Retriever d’évoluer efficacement à grande échelle pour des raisonnements à plusieurs étapes dans un domaine ouvert, tout en préservant une interprétabilité élevée. Nous évaluons GoldEn Retriever sur le jeu de données récemment proposé pour la QA ouverte à plusieurs étapes, HotpotQA, et démontrons qu’il surpasser le meilleur modèle publié précédemment, même sans recourir à des modèles pré-entraînés comme BERT.