HyperAIHyperAI
il y a 2 mois

Un Modèle en Cascade Profonde pour la Compréhension de Lecture Multidocument

Ming Yan; Jiangnan Xia; Chen Wu; Bin Bi; Zhongzhou Zhao; Ji Zhang; Luo Si; Rui Wang; Wei Wang; Haiqing Chen
Un Modèle en Cascade Profonde pour la Compréhension de Lecture Multidocument
Résumé

Un compromis fondamental entre l'efficacité et l'efficience doit être équilibré lors de la conception d'un système de réponse en ligne. L'efficacité provient de fonctions sophistiquées telles que la compréhension de lecture automatique extractive (MRC), tandis que l'efficience est obtenue grâce à des améliorations dans les composants préliminaires de récupération, tels que la sélection de documents candidats et le classement de paragraphes. Étant donné la complexité du scénario réel de MRC multi-document, il est difficile d'optimiser simultanément les deux aspects dans un système bout-à-bout. Pour résoudre ce problème, nous avons développé un nouveau modèle d'apprentissage en cascade profonde, qui évolue progressivement du classement au niveau des documents et des paragraphes vers une extraction plus précise des réponses grâce à la compréhension de lecture automatique. Plus précisément, les documents et paragraphes non pertinents sont d'abord filtrés avec des fonctions simples pour des considérations d'efficience. Ensuite, nous entraînons conjointement trois modules sur les textes restants afin d'améliorer le suivi de la réponse : l'extraction documentaire, l'extraction paragraphe et l'extraction de la réponse. Les résultats expérimentaux montrent que notre méthode proposée surpassent les méthodes précédentes de pointe sur deux jeux de données multi-document à grande échelle, à savoir TriviaQA et DuReader. De plus, notre système en ligne peut servir stablement des scénarios typiques avec plusieurs millions de requêtes quotidiennes en moins de 50 ms.

Un Modèle en Cascade Profonde pour la Compréhension de Lecture Multidocument | Articles de recherche récents | HyperAI