Aktionserkennung
Actionserkennung ist eine wichtige Unterdisziplin im Bereich der Computer Vision, die sich auf die Identifizierung und Kategorisierung menschlicher Aktivitäten in Videos konzentriert. Diese Aufgabe zielt darauf ab, verschiedene Arten von Aktionen durch die Analyse dynamischer Merkmale in Videosequenzen in vordefinierte Kategorien einzuordnen, um so eine automatische Verständnis von menschlichen Aktivitäten zu erreichen. Ihr Anwendungsspektrum ist breit und umfasst unter anderem intelligente Überwachung, Mensch-Maschine-Interaktion, Sportanalyse und andere Bereiche, die den Intelligenzgrad von Systemen und die Benutzererfahrung erheblich verbessern können.
Kinetics-400
MTV-H (WTS 60M)
Kinetics-600
MViT-B-24, 32x3
Charades
TokenLearner
Kinetics-700
MoViNet-A6
Toyota Smarthome dataset
π-ViT
AViD
TokenLearner
Moments in Time
ActivityNet-1.2
W-TALC
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
THUMOS’14
3C-Net
WiGesture
Kinetics-Sounds
MIT
InternVideo2-6B
TTStroke-21 ME22
RGB and PRGB
ActivityNet
UniFormerV2-L
BABEL
2s-AGCN
CelebV-HQ
Diving-48
DualPath w/ ViT-B/16
HMDB51
Jester test
MiniKinetics
MARS+RGB+Flow (16 frames)
Something-Something V2
AdaMAE
THUMOS'14
3C-Net
TTStroke-21 ME21
UCF101
Ours
YouCook2
VideoBERT (cross modal)