HyperAIHyperAI
vor 2 Monaten

Automatisierte Bewertung von Aufsätzen mit String-Kernen und Wort-Vektoren

Mădălina Cozma; Andrei M. Butnaru; Radu Tudor Ionescu
Automatisierte Bewertung von Aufsätzen mit String-Kernen und Wort-Vektoren
Abstract

In dieser Arbeit stellen wir einen Ansatz vor, der auf der Kombination von String-Kernen und Wort-Einbettungen (word embeddings) für die automatische Bewertung von Aufsätzen basiert. String-Kerne erfassen die Ähnlichkeit zwischen Zeichenketten durch das Zählen gemeinsamer Charakter-n-Gramme, einer niedrigstufigen aber mächtigen Art von Merkmalen, die in verschiedenen Textklassifikationsaufgaben wie der Identifikation arabischer Dialekte oder der Muttersprachenidentifikation standesgemäße Ergebnisse erzielen. Nach unserem besten Wissen sind wir die Ersten, die String-Kerne zur automatischen Bewertung von Aufsätzen anwenden. Wir sind auch die Ersten, die sie mit einer hochstufigen semantischen Merkmalsdarstellung kombinieren, nämlich dem "Sack" von Super-Wort-Einbettungen (bag-of-super-word-embeddings). Wir berichten über die beste Leistung im Datensatz des Automated Student Assessment Prize sowohl in den in-domain- als auch in den cross-domain-Szenarien, wobei wir moderne state-of-the-art Tiefenlernansätze übertreffen.