vor 11 Tagen
Dokumentzusammenfassung mit Textsegmentierung
Lesly Miculicich, Benjamin Han

Abstract
In diesem Artikel nutzen wir die inhärente Dokumentsegmentstruktur, um die Aufgabe der extraktiven Zusammenfassung zu verbessern. Wir entwickeln zwei Textsegmentierungsmodelle und ermitteln die optimalste Strategie zur Integration ihrer Vorhersagen in ein extraktives Zusammenfassungsmodell. Experimentelle Ergebnisse an einem Korpus wissenschaftlicher Artikel zeigen, dass die extraktive Zusammenfassung von einer hochgenauen Segmentierungsmethode profitiert. Insbesondere ist der größte Leistungszuwachs in Dokumenten zu verzeichnen, in denen die relevantesten Informationen nicht am Anfang stehen; daher schließen wir, dass die Segmentierung dazu beiträgt, das Lead-Bias-Problem zu verringern.