HyperAIHyperAI
vor 2 Monaten

Von der Textsegmentierung zum intelligenten Kapitelieren: Eine neue Benchmark für die Strukturierung von Video-Transkriptionen

Fabian Retkowski; Alexander Waibel
Von der Textsegmentierung zum intelligenten Kapitelieren: Eine neue Benchmark für die Strukturierung von Video-Transkriptionen
Abstract

Die Textsegmentierung ist eine grundlegende Aufgabe der natürlichen Sprachverarbeitung, bei der Dokumente in zusammenhängende Abschnitte aufgeteilt werden. Allerdings wurden bisherige Forschungen in diesem Bereich durch begrenzte Datensätze eingeschränkt, die entweder klein dimensioniert sind, synthetisch erzeugt wurden oder nur gut strukturierte Dokumente enthalten. In dieser Arbeit adressieren wir diese Einschränkungen durch die Einführung eines neuen Benchmarks namens YTSeg, der sich auf gesprochenen Inhalt konzentriert, der inhärent weniger strukturiert und sowohl thematisch als auch strukturell vielfältig ist. Als Teil dieser Arbeit stellen wir ein effizientes hierarchisches Segmentierungsmodell namens MiniSeg vor, das die aktuellen Standesmodelle übertrifft. Schließlich erweitern wir den Begriff der Textsegmentierung zu einer praktischeren "intelligenten Kapitelung", die die Segmentierung von unstrukturierten Inhalten, die Erstellung sinnvoller Segmenttitel und eine potentielle Echtzeit-Anwendung der Modelle umfasst.

Von der Textsegmentierung zum intelligenten Kapitelieren: Eine neue Benchmark für die Strukturierung von Video-Transkriptionen | Neueste Forschungsarbeiten | HyperAI