HyperAIHyperAI

Command Palette

Search for a command to run...

Effiziente zweistufige Netze für die zeitliche Aktionssegmentierung

Shenglan Liu YuHan Wang Li Xu Jie Zhu Lianyu Hu Lin Feng Kaiyuan Liu Zhuben Dong Yunheng Li

Zusammenfassung

Aufgrund von Grenzambiguitäten und Problemen der Übersegmentierung bleibt die Identifizierung aller Frames in langen, ungeschnittenen Videos weiterhin herausfordernd. Um diese Herausforderungen anzugehen, präsentieren wir das effiziente Zwei-Schritt-Netzwerk (Efficient Two-Step Network, ETSN) mit zwei Komponenten. Der erste Schritt von ETSN ist das Efficient Temporal Series Pyramid Network (ETSPNet), das sowohl lokale als auch globale frame-basierte Merkmale erfasst und präzise Vorhersagen der Segmentationsgrenzen liefert. Der zweite Schritt ist ein neuartiger, unsupervisierter Ansatz namens Local Burr Suppression (LBS), der die Übersegmentierungsfehler erheblich reduziert. Unsere empirischen Evaluierungen auf Benchmarks wie 50Salads, GTEA und Breakfast zeigen, dass ETSN die derzeitigen state-of-the-art-Methoden deutlich übertrifft.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Effiziente zweistufige Netze für die zeitliche Aktionssegmentierung | Paper | HyperAI