HyperAIHyperAI

Command Palette

Search for a command to run...

Temporale Faltungssnetze: Ein einheitlicher Ansatz zur Aktionssegmentierung

Colin Lea René Vidal Austin Reiter Gregory D. Hager

Zusammenfassung

Das vorherrschende Paradigma für die videosbasierte Aktionssegmentierung besteht aus zwei Schritten: Erstens wird für jedes Bildfeld mithilfe von Dense Trajectories oder einem Faltungsneuronalen Netzwerk (Convolutional Neural Network) niedrigstufige Merkmale berechnet, die lokal räumlich-zeitliche Informationen kodieren. Zweitens werden diese Merkmale in einen Klassifikator eingegeben, der hochstufige zeitliche Beziehungen erfasst, wie zum Beispiel ein Rekurrentes Neuronales Netzwerk (Recurrent Neural Network, RNN). Obwohl dieses Verfahren oft effektiv ist, erfordert die Trennung die Spezifizierung von zwei getrennten Modellen, jeweils mit ihren eigenen Komplexitäten, und verhindert das Erfassen feinerer langreichweitiger räumlich-zeitlicher Beziehungen. Wir schlagen einen vereinten Ansatz vor, wie er durch unser Zeitliches Faltungsnetzwerk (Temporal Convolutional Network, TCN) demonstriert wird, das hierarchisch Beziehungen auf niedrig-, mittel- und hochstufigen Zeitskalen erfasst. Unser Modell erreicht überlegene oder vergleichbare Leistungen bei der Nutzung von Video- oder Sensordaten auf drei öffentlichen Aktionssegmentierungsdatensätzen und kann in einem Bruchteil der Zeit trainiert werden, die für das Training eines RNN erforderlich ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Temporale Faltungssnetze: Ein einheitlicher Ansatz zur Aktionssegmentierung | Paper | HyperAI