Zeitliche Aktionserkennung
Temporal Action Localization ist eine Unterabgabe im Bereich der Computer Vision, die darauf abzielt, Aktivitäten in Videostreams zu erkennen und deren Start- und Endzeitstempel auszugeben. Diese Aufgabe bietet entscheidende Unterstützung für Anwendungen wie Videoanalyse, Überwachung und Inhaltsabruf, indem sie präzise festlegt, wann Aktionen in einem Video stattfinden. Sie ist eng verwandt mit der Generierung von Temporal Action Proposals und kann die Genauigkeit und Effizienz des Videoverstehens effektiv verbessern.
THUMOS’14
TSP
ActivityNet-1.3
AVFusion
HACS
TriDet (SlowFast)
FineAction
BMN (i3d feaure)
MultiTHUMOS
TriDet (VideoMAEv2)
CrossTask
VideoCLIP
EPIC-KITCHENS-100
AdaTAD (verb, VideoMAE-L)
MUSES
TemporalMaxer
ActivityNet-1.2
DeepMetricLearner
Ego4D MQ test
ActionFormer (SlowFast+Omnivore+EgoVLP)
Ego4D MQ val
MEXaction2
S-CNN
THUMOS'14
AVFusion
THUMOS14
BasicTAD (R50-SlowOnly)