HyperAIHyperAI
vor 16 Tagen

Sprachliche Merkmale zur Lesbarkeitsbewertung

Tovly Deutsch, Masoud Jasbi, Stuart Shieber
Sprachliche Merkmale zur Lesbarkeitsbewertung
Abstract

Die Bewertung der Lesbarkeit zielt darauf ab, Texte automatisch nach dem für Lernende geeigneten Schwierigkeitsniveau zu klassifizieren. Traditionelle Ansätze zur Lösung dieser Aufgabe nutzen eine Vielzahl linguistisch motivierter Merkmale in Kombination mit einfachen maschinellen Lernmodellen. Neuere Methoden haben die Leistung durch Verzicht auf diese Merkmale und den Einsatz tiefer Lernmodelle verbessert. Es ist jedoch unklar, ob die Leistung tiefer Lernmodelle weiter gesteigert werden kann, wenn sie durch linguistisch motivierte Merkmale ergänzt werden. In diesem Artikel kombinieren wir diese beiden Ansätze mit dem Ziel, die Gesamtleistung der Modelle zu verbessern und diese Frage zu klären. Bei der Evaluation an zwei großen Korpora zur Lesbarkeit zeigen wir, dass die Hinzufügung linguistisch motivierter Merkmale zu tiefen Lernmodellen bei ausreichendem Trainingsdatenvolumen keine Verbesserung der aktuellen State-of-the-Art-Leistung bewirkt. Unsere Ergebnisse liefern erste Hinweise für die Hypothese, dass State-of-the-Art-Modelle des tiefen Lernens bereits linguistische Merkmale des Textes erfassen, die mit der Lesbarkeit zusammenhängen. Zukünftige Forschung zur Natur der in diesen Modellen gebildeten Darstellungen könnte Einblicke in die gelernten Merkmale und deren Beziehung zu den in traditionellen Ansätzen hypothetisch postulierten linguistischen Merkmalen ermöglichen.

Sprachliche Merkmale zur Lesbarkeitsbewertung | Neueste Forschungsarbeiten | HyperAI