Aktionserkennung
Actionserkennung ist eine wichtige Unterdisziplin im Bereich der Computer Vision, die sich auf die Identifizierung und Kategorisierung menschlicher Aktivitäten in Videos konzentriert. Diese Aufgabe zielt darauf ab, verschiedene Arten von Aktionen durch die Analyse dynamischer Merkmale in Videosequenzen in vordefinierte Kategorien einzuordnen, um so eine automatische Verständnis von menschlichen Aktivitäten zu erreichen. Ihr Anwendungsspektrum ist breit und umfasst unter anderem intelligente Überwachung, Mensch-Maschine-Interaktion, Sportanalyse und andere Bereiche, die den Intelligenzgrad von Systemen und die Benutzererfahrung erheblich verbessern können.
Kinetics-400
MTV-H (WTS 60M)
Kinetics-600
MViT-B-24, 32x3
Charades
TokenLearner
Kinetics-700
MoViNet-A6
Toyota Smarthome dataset
π-ViT
AViD
TokenLearner
Moments in Time
WiGesture
THUMOS’14
3C-Net
ActivityNet-1.2
W-TALC
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
Kinetics-Sounds
MIT
InternVideo2-6B
TTStroke-21 ME22
RGB and PRGB
THUMOS'14
3C-Net
Diving-48
DualPath w/ ViT-B/16
MiniKinetics
MARS+RGB+Flow (16 frames)
ActivityNet
UniFormerV2-L
CelebV-HQ
TTStroke-21 ME21
UCF101
Ours
HMDB51
Jester test
Something-Something V2
AdaMAE
BABEL
2s-AGCN
YouCook2
VideoBERT (cross modal)