Approche fondée sur le contexte pour l'acquisition d'une deuxième langue

La tâche SLAM 2018 se concentre sur la prédiction des erreurs commises par un étudiant lors de l'utilisation de l'application Duolingo. Dans cet article, nous décrivons le système que nous avons développé pour cette tâche partagée. Notre système utilise un modèle de régression logistique pour prédire la probabilité qu’un étudiant commette une erreur lors de la réponse à un exercice sur Duolingo, sur les trois parcours linguistiques : anglais/espagnol (en/es), espagnol/anglais (es/en) et français/anglais (fr/en). Lors du développement de ce système, nous avons mené une étude d’ablation sur plusieurs caractéristiques et avons constaté que les caractéristiques basées sur le contexte jouent un rôle essentiel dans la modélisation de l’acquisition d’une langue. Notre modèle surpasser les scores de référence de Duolingo sur les trois parcours linguistiques (scores AUROC : en/es = 0,821, es/en = 0,790, fr/en = 0,812). Ce travail met en évidence l’importance de fournir un contexte textuel favorable aux étudiants lors de l’apprentissage d’une langue seconde.