Generatives adversariales Netzwerk für abstraktive Textzusammenfassung

In dieser Arbeit schlagen wir einen adversären Prozess für die abstraktive Textzusammenfassung vor, bei dem wir ein generatives Modell G und ein diskriminatives Modell D gleichzeitig trainieren. Insbesondere bauen wir den Generator G als Agenten des Reinforcement Learnings auf, der den Rohtext als Eingabe erhält und die abstraktive Zusammenfassung vorhersagt. Zudem entwickeln wir einen Diskriminator, der versucht, die erzeugte Zusammenfassung von der Ground-Truth-Zusammenfassung zu unterscheiden. Umfangreiche Experimente zeigen, dass unser Modell wettbewerbsfähige ROUGE-Werte auf dem CNN/Daily Mail-Datensatz erreicht, vergleichbar mit den besten bisherigen Methoden. Qualitativ demonstrieren wir, dass unser Modell in der Lage ist, abstraktivere, lesbarere und vielfältigere Zusammenfassungen zu erzeugen.