Salience Allocation als Leitfaden für abstraktive Zusammenfassung

Abstraktive Zusammenfassungsmodelle lernen typischerweise, die wesentlichen Informationen implizit von Grund auf zu erfassen. In der jüngsten Literatur wird extraktive Zusammenfassungen als Anleitung für abstraktive Modelle eingesetzt, um Hinweise auf wesentliche Inhalte zu liefern und so eine verbesserte Leistung zu erzielen. Allerdings können extraktive Zusammenfassungen als Anleitung zu streng sein und zu Informationsverlust oder verrauschten Signalen führen. Zudem ist eine Anpassung an Dokumente mit unterschiedlichem Grad an Abstraktivität nicht leicht möglich. Da die Anzahl und Verteilung der wesentlichen Inhaltsstücke variiert, ist es schwierig, einen festen Schwellenwert zu finden, der bestimmt, welche Inhalte in die Anleitung aufgenommen werden sollen. In diesem Paper stellen wir einen neuartigen Ansatz zur Zusammenfassung vor, der über eine flexible und zuverlässige Anleitung zur Salienzverteilung verfügt, namens SEASON (SaliencE Allocation as Guidance for Abstractive SummarizatiON). SEASON nutzt die Verteilung der erwarteten Salienz, um die abstraktive Zusammenfassung zu leiten und zeigt sich gut anpassungsfähig an Artikel mit unterschiedlichem Abstraktivitätsgrad. Automatisierte und menschliche Bewertungen auf zwei Standard-Datensätzen zeigen, dass der vorgeschlagene Ansatz wirksam und zuverlässig ist. Empirische Ergebnisse auf mehr als einer Million Nachrichtenartikel deuten auf eine natürliche Aufteilung der Salienz im Verhältnis 15:50 für Satzanteile in Nachrichten hin und liefern so einen wertvollen Einblick für die Gestaltung von Nachrichtenartikeln.