Neuronale Dokumentenzusammenfassung durch gemeinsames Lernen von Satzbewertung und -auswahl

Satzbewertung und Satzauswahl sind die beiden Hauptschritte in extraktiven Dokumentzusammenfassungssystemen. Bislang wurden diese jedoch als zwei getrennte Teilbereiche behandelt. In dieser Arbeit stellen wir ein neues, von Anfang bis Ende konzipiertes neuronales Netzwerkframework für extraktive Dokumentzusammenfassungen vor, das die Bewertung und Auswahl der Sätze gemeinsam lernt. Zunächst liest es die Dokumentsätze mit einem hierarchischen Encoder, um deren Darstellung zu ermitteln. Danach baut es die Ausgabe-Zusammenfassung schrittweise durch die Extraktion einzelner Sätze auf. Im Gegensatz zu früheren Methoden integriert unser Ansatz die Auswahlstrategie in das Bewertungsmodell, das direkt die relative Bedeutung unter Berücksichtigung bereits ausgewählter Sätze voraussagt. Experimente mit dem CNN/Daily Mail-Datensatz zeigen, dass das vorgeschlagene Framework den aktuellen Stand der Technik in Bezug auf extraktive Zusammenfassungsmodelle deutlich übertrifft.