Ein auf Sprachmodellen basierender Evaluierer für Satzkompression

Hier präsentieren wir einen auf Sprachmodellen basierenden Evaluationsansatz für die Satzkompression durch Löschoperationen und betrachten diese Aufgabe als eine Folge von Lösch- und Bewertungsoperationen, die mithilfe des Evaluators durchgeführt werden. Genauer handelt es sich beim Evaluationsmodell um ein syntaktisches neuronales Sprachmodell, das zunächst durch das Lernen der syntaktischen und strukturellen Kollokationen zwischen Wörtern aufgebaut wird. Anschließend werden über einen Verstärkungslernrahmen eine Reihe von Versuch-und-Irrtum-Löschoperationen an den Quelltexten durchgeführt, um die optimale Zielkompression zu erzielen. Eine empirische Studie zeigt, dass das vorgeschlagene Modell effektiv lesbare Kompressionen generieren kann, die mit mehreren starken Baselines vergleichbar oder sogar überlegen sind. Darüber hinaus führen wir einen Testdatensatz mit 200 Sätzen für einen großskaligen Datensatz ein und legen damit eine neue Benchmark für zukünftige Forschungsarbeiten fest.