Lernen, kohärente Zusammenfassungen mittels Deep Reinforcement Learning zu extrahieren

Kohärenz spielt eine entscheidende Rolle bei der Erstellung einer hochwertigen Zusammenfassung aus einem Dokument. In den letzten Jahren wird die neurale extraktive Zusammenfassung zunehmend attraktiv. Dennoch ignorieren die meisten Ansätze die Kohärenz von Zusammenfassungen beim Extrahieren von Sätzen. Als Beitrag zur Extraktion kohärenter Zusammenfassungen schlagen wir ein neuronales Kohärenzmodell vor, das die semantischen und syntaktischen Kohärenzmuster über Satzgrenzen hinweg erfasst. Das vorgeschlagene neuronale Kohärenzmodell entfällt die Notwendigkeit der Merkmalsextraktion und kann auf unmarkierten Daten in einem End-to-End-Verfahren trainiert werden. Empirische Ergebnisse zeigen, dass das vorgeschlagene neuronale Kohärenzmodell die über Satzgrenzen hinweg bestehenden Kohärenzmuster effizient erfassen kann. Unter Verwendung der kombinierten Ausgabe des neuronalen Kohärenzmodells und des ROUGE-Pakets als Belohnung entwickeln wir eine Verstärkungslernmethode, um einen vorgeschlagenen neuronalen extraktiven Zusammenfasser zu trainieren, der als Reinforced Neural Extractive Summarization (RNES) Modell bezeichnet wird. Das RNES-Modell lernt gleichzeitig die Optimierung von Kohärenz und informativer Bedeutung der Zusammenfassung. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene RNES existierende Baseline-Methoden übertreffen und den aktuellen Stand der Technik in Bezug auf ROUGE auf dem CNN/Daily Mail-Datensatz erreicht. Die qualitative Bewertung zeigt, dass die durch RNES erzeugten Zusammenfassungen kohärenter und lesbarer sind.