HyperAIHyperAI
il y a 17 jours

Amélioration de la modélisation des connaissances par pré-entraînement des embeddings de questions

Yunfei Liu, Yang Yang, Xianyu Chen, Jian Shen, Haifeng Zhang, Yong Yu
Amélioration de la modélisation des connaissances par pré-entraînement des embeddings de questions
Résumé

La traçabilité des connaissances (Knowledge Tracing, KT) consiste à prédire si un étudiant peut répondre correctement à une question en se basant sur son historique de réponses. Bien que de nombreuses recherches aient été consacrées à l’exploitation des informations contenues dans les questions, une grande quantité d’informations avancées présentes entre les questions et les compétences n’a pas été suffisamment extraite, ce qui rend difficile la performance adéquate des approches antérieures. Dans cet article, nous démontrons qu’une amélioration significative dans la KT peut être obtenue en pré-entraînant les embeddings de chaque question à partir d’une abondante information secondaire, puis en entraînant des modèles profonds de KT à partir des embeddings ainsi obtenus. Plus précisément, l’information secondaire inclut la difficulté des questions ainsi que trois types de relations présentes dans un graphe biparti reliant les questions aux compétences. Pour pré-entraîner les embeddings des questions, nous proposons d’utiliser des réseaux neuronaux basés sur le produit afin de reconstruire cette information secondaire. En conséquence, l’adoption des embeddings pré-entraînés dans des modèles profonds de KT existants permet d’obtenir des performances nettement supérieures aux meilleures méthodes actuelles sur trois jeux de données couramment utilisés en KT.