HyperAIHyperAI

Command Palette

Search for a command to run...

Temporale Aktionserkennung mit strukturierten Segmentnetzwerken

Yue Zhao Yuanjun Xiong Limin Wang Zhirong Wu Xiaoou Tang Dahua Lin

Zusammenfassung

Die Erkennung von Aktionen in unbeschnittenen Videos ist eine wichtige, jedoch herausfordernde Aufgabe. In dieser Arbeit stellen wir das strukturierte Segmentnetzwerk (SSN) vor, ein neues Framework, das die zeitliche Struktur jeder Aktion durch eine strukturierte zeitliche Pyramide modelliert. An der Spitze der Pyramide führen wir ein zerlegtes diskriminatives Modell ein, das aus zwei Klassifizierern besteht: einer für die Klassifikation von Aktionen und einer für die Bestimmung der Vollständigkeit. Dies ermöglicht es dem Framework, positive Vorschläge effektiv vom Hintergrund oder unvollständigen Vorschlägen zu unterscheiden, was sowohl eine genaue Erkennung als auch eine präzise Lokalisierung ermöglicht. Diese Komponenten werden in ein einheitliches Netzwerk integriert, das effizient in einem end-to-end-Verfahren trainiert werden kann. Zudem wurde ein einfaches, aber effektives Schema zur Generierung hochwertiger Aktionenvorschläge entwickelt, das als zeitliche Aktionsgruppierung (Temporal Actionness Grouping, TAG) bezeichnet wird. Bei den beiden anspruchsvollen Benchmarks THUMOS14 und ActivityNet übertrifft unsere Methode erheblich die bisher besten Verfahren und zeigt dabei eine überlegene Genauigkeit sowie starke Anpassungsfähigkeit bei der Bearbeitung von Aktionen mit unterschiedlichen zeitlichen Strukturen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp