Zur Vereinheitlichung der Textsegmentierung und der Zusammenfassung langer Dokumente

Die Segmentierung von Texten ist entscheidend für die Signalisierung der Struktur eines Dokuments. Ohne die Aufteilung eines langen Dokuments in thematisch kohärente Abschnitte ist es für Leser schwierig, den Text zu verstehen, geschweige denn, wichtige Informationen zu finden. Dieses Problem verschärft sich zusätzlich bei Transkripten von Audio- oder Videomaterial, die oft nicht segmentiert sind. In diesem Paper untersuchen wir die Rolle der Abschnittssegmentierung bei der extraktiven Zusammenfassung schriftlicher und mündlicher Dokumente. Unser Ansatz erlernt robuste Satzrepräsentationen, indem er Zusammenfassung und Segmentierung gleichzeitig durchführt, wobei eine auf Optimierung basierende Regularisierung weiterhin die Auswahl diverser Zusammenfassungssätze fördert. Wir führen Experimente auf mehreren Datensätzen durch, die von wissenschaftlichen Artikeln bis hin zu gesprochenen Transkripten reichen, um die Leistungsfähigkeit des Modells zu bewerten. Unsere Ergebnisse zeigen, dass das Modell nicht nur auf öffentlich verfügbaren Benchmarks Spitzenleistungen erzielt, sondern auch eine bessere Übertragbarkeit zwischen verschiedenen Genres aufweist, wenn Textsegmentierung integriert ist. Wir führen eine Reihe von Analysen durch, um den Einfluss der Abschnittssegmentierung auf die Zusammenfassung von schriftlichen und mündlichen Dokumenten hoher Länge und Komplexität quantitativ zu erfassen.