Action Classification
La classification d'actions est une tâche importante dans le domaine de la vision par ordinateur, axée sur la reconnaissance et la catégorisation des actions humaines dans les vidéos. Cette tâche vise à classer avec précision différents types d'actions dans des catégories prédéfinies en analysant les caractéristiques dynamiques des séquences vidéo, permettant ainsi une compréhension automatique des activités humaines. Sa valeur d'application est considérable, incluant notamment la surveillance intelligente, l'interaction homme-machine, l'analyse sportive et d'autres domaines, ce qui peut considérablement améliorer le niveau d'intelligence des systèmes et l'expérience utilisateur.
ActivityNet
UniFormerV2-L
ActivityNet-1.2
W-TALC
AViD
TokenLearner
BABEL
2s-AGCN
CelebV-HQ
Charades
TokenLearner
Diving-48
DualPath w/ ViT-B/16
HMDB51
Jester test
Kinetics-400
InternVideo
Kinetics-600
MViT-L (train from scratch)
Kinetics-700
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
Kinetics-Sounds
MiniKinetics
MARS+RGB+Flow (16 frames)
MIT
InternVideo2-6B
Moments in Time
Something-Something V2
AdaMAE
THUMOS'14
3C-Net
THUMOS’14
3C-Net
Toyota Smarthome dataset
π-ViT
TTStroke-21 ME22
RGB and PRGB
TTStroke-21 ME21
UCF101
Ours
WiGesture
YouCook2
VideoBERT (cross modal)
MoViNet-A6