HTSS: Eine neue hybride Architektur zur Textzusammenfassung und -vereinfachung
Textvereinfachung und Textzusammenfassung sind verwandte, jedoch unterschiedliche Teilaufgaben im Bereich der natürlichen Sprachgenerierung. Während die Zusammenfassung darauf abzielt, die Länge eines Dokuments zu reduzieren, ohne den ursprünglichen Sinn zu verändern, versucht die Vereinfachung, die Komplexität eines Dokuments zu verringern. In dieser Arbeit kombinieren wir beide Aufgaben – Zusammenfassung und Vereinfachung – mithilfe einer neuartigen hybriden Architektur aus abstraktiver und extraktiver Zusammenfassung, die als HTSS bezeichnet wird. Wir erweitern das gut bekannte Pointer-Generator-Modell für die kombinierte Aufgabe der Zusammenfassung und Vereinfachung. Unser paralleles Korpus wurde aus vereinfachten Zusammenfassungen von Fachexperten entnommen, die auf der Wissenschaftsnachrichtenplattform EurekaAlert (www.eurekalert.org) veröffentlicht wurden. Unsere Ergebnisse zeigen, dass unser vorgeschlagenes HTSS-Modell sowohl im SARI-Score gegenüber neuraler Textvereinfachung (NTS) als auch im ROUGE-Score gegenüber abstraktiver Textzusammenfassung (ATS) überlegen ist. Zudem führen wir eine neue Metrik (CSS1) ein, die SARI und ROUGE kombiniert, und demonstrieren, dass unser HTSS-Modell die Aufgaben der Vereinfachung und Zusammenfassung gemeinsam um 38,94 % bzw. 53,40 % besser löst als NTS und ATS. Wir stellen sämtlichen Code, Modelle und Korpora der wissenschaftlichen Gemeinschaft zur Verfügung, um zukünftige Forschung zu ermöglichen, unter folgender URL: https://github.com/slab-itu/HTSS/.