Compréhension du texte avec le réseau Attention Sum Reader

Plusieurs grands ensembles de données de type « cloze » (contexte-question-réponse) ont été récemment introduits : les données d'actualités CNN et Daily Mail ainsi que le Test des Livres pour Enfants (Children's Book Test). Grâce à leur taille, ces ensembles de données sont particulièrement adaptés aux techniques d'apprentissage profond qui semblent actuellement surpasser toutes les approches alternatives. Nous présentons un nouveau modèle simple qui utilise l'attention pour sélectionner directement la réponse dans le contexte, contrairement aux modèles similaires qui calculent généralement la réponse à partir d'une représentation mixte des mots du document. Cette caractéristique rend le modèle particulièrement adapté aux problèmes de questions-réponses où la réponse est un seul mot issu du document. Un ensemble de nos modèles établit un nouveau niveau de performance sur tous les ensembles de données évalués.