Action Classification
Aktionserkennung ist eine wichtige Unterdisziplin im Bereich der Computer Vision und konzentriert sich auf die Identifizierung und Kategorisierung menschlicher Aktionen in Videos. Diese Aufgabe zielt darauf ab, verschiedene Arten von Aktionen durch die Analyse dynamischer Merkmale in Videosequenzen in vordefinierte Kategorien einzuordnen, um so das automatische Verständnis menschlicher Aktivitäten zu erreichen. Ihr Anwendungspotenzial ist weitreichend und umfasst Bereiche wie intelligente Überwachung, Mensch-Maschine-Interaktion, Sportanalyse und andere, die den Intelligenzgrad von Systemen und die Benutzererfahrung erheblich verbessern können.
ActivityNet
UniFormerV2-L
ActivityNet-1.2
W-TALC
AViD
TokenLearner
BABEL
2s-AGCN
CelebV-HQ
Charades
TokenLearner
Diving-48
DualPath w/ ViT-B/16
HMDB51
Jester test
Kinetics-400
InternVideo
Kinetics-600
MViT-L (train from scratch)
Kinetics-700
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
Kinetics-Sounds
MiniKinetics
MARS+RGB+Flow (16 frames)
MIT
InternVideo2-6B
Moments in Time
Something-Something V2
AdaMAE
THUMOS'14
3C-Net
THUMOS’14
3C-Net
Toyota Smarthome dataset
π-ViT
TTStroke-21 ME22
RGB and PRGB
TTStroke-21 ME21
UCF101
Ours
WiGesture
YouCook2
VideoBERT (cross modal)
MoViNet-A6