HyperAIHyperAI

Command Palette

Search for a command to run...

Ein Divide-and-Conquer-Ansatz zur Zusammenfassung langer Dokumente

Alexios Gidiotis Grigorios Tsoumakas

Zusammenfassung

Wir stellen eine neuartige Divide-and-Conquer-Methode für die neuronale Zusammenfassung langer Dokumente vor. Unsere Methode nutzt die diskursiven Strukturen des Dokuments aus und verwendet Satzähnlichkeit, um das Problem in eine Ensemble von kleineren Zusammenfassungsproblemen zu zerlegen. Insbesondere zerlegen wir ein langes Dokument und seine Zusammenfassung in mehrere Quell-Ziel-Paare, die zur Ausbildung eines Modells verwendet werden, das lernt, jeweils einzelne Abschnitte des Dokuments separat zusammenzufassen. Diese Teilzusammenfassungen werden anschließend kombiniert, um eine endgültige vollständige Zusammenfassung zu erzeugen. Mit diesem Ansatz können wir das Problem der Zusammenfassung langer Dokumente in kleinere und einfachere Teilprobleme zerlegen, die Rechenkomplexität reduzieren und gleichzeitig mehr Trainingsbeispiele generieren, die im Vergleich zum herkömmlichen Ansatz weniger Rauschen in den Zielzusammenfassungen aufweisen. Wir zeigen, dass dieser Ansatz in Kombination mit verschiedenen Zusammenfassungsmodellen – einschließlich sequenz-zu-Sequenz RNNs und Transformers – zu einer verbesserten Zusammenfassungsleistung führen kann. Unsere besten Modelle erreichen Ergebnisse, die mit dem Stand der Technik auf zwei öffentlich verfügbaren Datensätzen akademischer Artikel vergleichbar sind.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Ein Divide-and-Conquer-Ansatz zur Zusammenfassung langer Dokumente | Paper | HyperAI