HyperAIHyperAI
vor 2 Monaten

Überwachte und nicht überwachte neuronale Ansätze zur Textverständlichkeit

Matej Martinc; Senja Pollak; Marko Robnik-Šikonja
Überwachte und nicht überwachte neuronale Ansätze zur Textverständlichkeit
Abstract

Wir präsentieren eine Reihe neuer neuronaler überwachter und nicht überwachter Ansätze zur Bestimmung der Lesbarkeit von Dokumenten. Im nicht überwachten Szenario nutzen wir neuronale Sprachmodelle, während im überwachten Szenario drei verschiedene neuronale Klassifikationsarchitekturen getestet werden. Wir zeigen, dass der vorgeschlagene neuronale nicht überwachte Ansatz robust ist, sich über Sprachgrenzen hinweg transferieren lässt und eine Anpassung an eine spezifische Lesbarkeitsaufgabe und Datensatz ermöglicht. Durch systematische Vergleiche verschiedener neuronalen Architekturen auf mehreren Benchmark- und neuen annotierten Lesbarkeitsdatensätzen in zwei Sprachen bietet diese Studie zudem eine umfassende Analyse verschiedener neuraler Ansätze zur Lesbarkeitsklassifikation. Wir legen ihre Stärken und Schwächen offen, vergleichen ihre Leistung mit den aktuellen Stand der Technik in der Klassifikation von Lesbarkeit, die in den meisten Fällen noch auf umfangreiche Merkmalsingenieurkunst (feature engineering) basiert, und schlagen Verbesserungsmöglichkeiten vor.

Überwachte und nicht überwachte neuronale Ansätze zur Textverständlichkeit | Neueste Forschungsarbeiten | HyperAI