Struktur in Zusammenfassungen bringen: Ein facettierter Datensatz für lange wissenschaftliche Dokumente

Die facetierte Zusammenfassung bietet Kurzdarstellungen eines Dokuments aus verschiedenen Perspektiven. Leser können mit Hilfe einer strukturierten Gliederung die wesentlichen Punkte eines langen Dokuments schnell erfassen. Allerdings wurde bisher nur wenig Forschung zu diesem Thema betrieben, teilweise aufgrund des Mangels an umfangreichen Datensätzen zur facetierten Zusammenfassung. In dieser Studie stellen wir FacetSum vor, einen Benchmark für facetierte Zusammenfassungen, der auf Artikeln des Emerald-Verlags basiert und eine vielfältige Domänenabdeckung bietet. Im Gegensatz zu traditionellen Dokument-Zusammenfassungs-Paaren bietet FacetSum mehrere Zusammenfassungen, die jeweils auf spezifische Abschnitte eines langen Dokuments abzielen, einschließlich Zweck, Methode, Ergebnisse und Wert (purpose, method, findings, and value). Analysen und empirische Ergebnisse unseres Datensatzes verdeutlichen die Bedeutung der Strukturierung von Zusammenfassungen. Wir glauben, dass FacetSum weitere Fortschritte in der Forschung zur Zusammenfassung fördern und die Entwicklung von NLP-Systemen unterstützen wird, die die strukturierte Information sowohl in langen Texten als auch in Zusammenfassungen nutzen können.