Action Recognition
Temporal Action Localization ist eine Unterabgabe im Bereich der Computer Vision, die darauf abzielt, Aktivitäten in Videostreams zu erkennen und deren Start- und Endzeitstempel auszugeben. Diese Aufgabe bietet entscheidende Unterstützung für Anwendungen wie Videoanalyse, Überwachung und Inhaltsabruf, indem sie präzise festlegt, wann Aktionen in einem Video stattfinden. Sie ist eng verwandt mit der Generierung von Temporalen Aktionenvorschlägen und kann die Genauigkeit und Effizienz des Videoverstehens effektiv verbessern.
ActivityNet-1.2
DeepMetricLearner
ActivityNet-1.3
AVFusion
CrossTask
VideoCLIP
Ego4D MQ test
ActionFormer (SlowFast+Omnivore+EgoVLP)
Ego4D MQ val
EPIC-KITCHENS-100
AdaTAD (verb, VideoMAE-L)
FineAction
VideoMAE V2-g
HACS
RDFA-S6 (InternVideo2-6B)
MEXaction2
S-CNN
MultiTHUMOS
TriDet (VideoMAEv2)
MUSES
TemporalMaxer
THUMOS'14
AVFusion
THUMOS’14
ActionFormer (VideoMAE V2-g features)
THUMOS14
BasicTAD (R50-SlowOnly)