GoSum: Extraktive Zusammenfassung langer Dokumente durch Verstärkungslernen und graphbasierte Diskurszustandsorganisation

Die Zusammenfassung von langen Dokumenten kann als eine Satz-Klassifikation betrachtet werden, die die strukturellen Informationen des Dokuments nutzt. Die Nutzung solcher struktureller Informationen zur Generierung einer Zusammenfassung ist jedoch herausfordernd. In diesem Paper stellen wir GoSum vor, ein neuartiges extraktives Modell für die Zusammenfassung langer wissenschaftlicher Artikel, das auf Graphen und Verstärkungslernen basiert. Insbesondere kodiert GoSum Satz-Zustände im Rahmen des Verstärkungslernens, indem für jedes Eingabedokument auf unterschiedlichen diskursiven Ebenen ein heterogener Graph aufgebaut wird. Eine Kante im Graphen spiegelt die diskursive Hierarchie des Dokuments wider und dient dazu, semantische Abweichungen über Abschnittsgrenzen hinweg zu unterdrücken. Wir evaluieren GoSum auf zwei Datensätzen zur Zusammenfassung wissenschaftlicher Artikel: PubMed und arXiv. Die experimentellen Ergebnisse zeigen, dass GoSum gegenüber starken Baselines sowohl extraktiver als auch abstraktiver Modelle Ergebnisse auf dem Stand der Technik erreicht. Zusätzliche Ablationsstudien bestätigen, dass die Leistungsfähigkeit von GoSum maßgeblich auf der Nutzung diskursiver Informationen beruht.