Verbesserung der Wissensverfolgung durch Vortrainieren von Frage-Embeddings

Wissensverfolgung (Knowledge Tracing, KT) bezeichnet die Aufgabe, vorherzusagen, ob Schüler Fragen korrekt beantworten können, basierend auf ihren historischen Antworten. Obwohl zahlreiche Forschungsarbeiten darauf abzielen, die Informationen zu Fragen optimal auszunutzen, wurde bisher eine Fülle an fortgeschrittenen Informationen zwischen Fragen und Fähigkeiten (Skills) nicht hinreichend extrahiert, was die Leistungsfähigkeit früherer Ansätze erheblich einschränkt. In diesem Artikel zeigen wir, dass erhebliche Verbesserungen in der KT erreicht werden können, indem man zunächst Embeddings für jede Frage anhand reichhaltiger Nebeninformationen vortrainiert und anschließend tiefgehende KT-Modelle auf diesen abgeleiteten Embeddings trainiert. Konkret umfasst die Nebeninformation Frage-Schwierigkeit sowie drei Arten von Beziehungen, die in einem bipartiten Graphen zwischen Fragen und Fähigkeiten enthalten sind. Zur Vortrainierung der Frage-Embeddings schlagen wir vor, produktbasierte neuronale Netze einzusetzen, um die Nebeninformationen effektiv wiederherzustellen. Die Ergebnisse zeigen, dass die Verwendung dieser vortrainierten Embeddings in bestehenden tiefen KT-Modellen die Leistung gegenüber aktuellen State-of-the-Art-Baselines auf drei gängigen KT-Datensätzen signifikant übertrifft.