Aggrégation de preuves pour le réclassement des réponses dans l'interrogation ouverte en question-réponse

Une approche populaire récente pour répondre à des questions de domaine ouvert consiste d'abord à rechercher des passages pertinents liés à la question, puis à appliquer des modèles de compréhension de la lecture pour extraire les réponses. Les méthodes existantes extraient généralement les réponses de manière indépendante à partir de passages individuels. Cependant, certaines questions nécessitent une combinaison d'éléments probants provenant de différentes sources pour être correctement résolues. Dans cet article, nous proposons deux modèles qui utilisent plusieurs passages pour générer leurs réponses. Les deux modèles utilisent une approche de re-rangage des réponses qui réordonne les candidats générés par un modèle QA (Question Answering) existant et de pointe. Nous proposons deux méthodes, le re-rangage basé sur la force et le re-rangage basé sur la couverture, pour tirer parti des preuves agrégées provenant de différents passages afin de déterminer l'answer avec plus de précision. Nos modèles ont obtenu des résultats d'état de l'art sur trois ensembles de données publics de QA en domaine ouvert : Quasar-T, SearchQA et la version en domaine ouvert de TriviaQA, avec une amélioration d'environ 8 points de pourcentage sur les deux premiers ensembles de données.