HyperAIHyperAI

Command Palette

Search for a command to run...

Von der Textsegmentierung zum intelligenten Kapitelieren: Eine neue Benchmark für die Strukturierung von Video-Transkriptionen

Fabian Retkowski Alexander Waibel

Zusammenfassung

Die Textsegmentierung ist eine grundlegende Aufgabe der natürlichen Sprachverarbeitung, bei der Dokumente in zusammenhängende Abschnitte aufgeteilt werden. Allerdings wurden bisherige Forschungen in diesem Bereich durch begrenzte Datensätze eingeschränkt, die entweder klein dimensioniert sind, synthetisch erzeugt wurden oder nur gut strukturierte Dokumente enthalten. In dieser Arbeit adressieren wir diese Einschränkungen durch die Einführung eines neuen Benchmarks namens YTSeg, der sich auf gesprochenen Inhalt konzentriert, der inhärent weniger strukturiert und sowohl thematisch als auch strukturell vielfältig ist. Als Teil dieser Arbeit stellen wir ein effizientes hierarchisches Segmentierungsmodell namens MiniSeg vor, das die aktuellen Standesmodelle übertrifft. Schließlich erweitern wir den Begriff der Textsegmentierung zu einer praktischeren "intelligenten Kapitelung", die die Segmentierung von unstrukturierten Inhalten, die Erstellung sinnvoller Segmenttitel und eine potentielle Echtzeit-Anwendung der Modelle umfasst.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Von der Textsegmentierung zum intelligenten Kapitelieren: Eine neue Benchmark für die Strukturierung von Video-Transkriptionen | Paper | HyperAI