Compréhension du Langage Naturel avec l'EpiReader

Nous présentons l'EpiReader, un modèle novateur pour la compréhension automatique du texte. La compréhension automatique de textes non structurés et du monde réel est un objectif majeur de la recherche en traitement automatique des langues naturelles. Les tests actuels de compréhension automatique posent des questions dont les réponses peuvent être déduites à partir d'un texte de référence, et évaluent la réponse d'un modèle à ces questions. L'EpiReader est un modèle neuronal intégré composé de deux composants : le premier composant propose un petit ensemble de réponses potentielles après avoir comparé une question au texte de référence, tandis que le second composant formule des hypothèses en utilisant les candidats proposés et la question, puis re-rangée ces hypothèses en fonction de leur concordance estimée avec le texte de référence. Nous présentons des expériences démontrant que l'EpiReader établit un nouveau niveau d'excellence sur les benchmarks de compréhension automatique CNN et Children's Book Test, surpassant considérablement les modèles neuronaux précédents.