Appariement de contexte multi-perspectives pour la compréhension machine

Les ensembles de données précédents en compréhension automatique (CA) sont soit trop petits pour entraîner des modèles d'apprentissage profond de bout en bout, soit pas assez difficiles pour évaluer les capacités des techniques actuelles de CA. Le nouvel ensemble de données SQuAD (Stanford Question Answering Dataset) atténue ces limitations et nous offre l'opportunité de développer des modèles de CA plus réalistes. Sur la base de cet ensemble de données, nous proposons un modèle Multi-Perspective Context Matching (MPCM), qui est un système de bout en bout capable de prédire directement les points de début et de fin d'une réponse dans un passage.Notre modèle ajuste d'abord chaque vecteur d'incrustation lexicale (word-embedding) du passage en multipliant une pondération pertinence calculée à partir de la question. Ensuite, nous encodons la question et le passage pondéré à l'aide de LSTM bidirectionnels (Long Short-Term Memory). Pour chaque point du passage, notre modèle compare le contexte de ce point avec la question encodée sous plusieurs angles et génère un vecteur correspondance. À partir de ces vecteurs correspondants, nous utilisons une autre LSTM bidirectionnelle pour agréger toutes les informations et prédire les points de début et de fin.Les résultats expérimentaux sur l'ensemble de test SQuAD montrent que notre modèle obtient un résultat compétitif au classement.