Classification d'action
La classification d'actions est une tâche importante dans le domaine de la vision par ordinateur, axée sur la reconnaissance et la catégorisation des actions humaines dans les vidéos. Cette tâche vise à classer avec précision différents types d'actions dans des catégories prédéfinies en analysant les caractéristiques dynamiques des séquences vidéo, permettant ainsi une compréhension automatique des activités humaines. Sa valeur d'application est considérable, incluant notamment la surveillance intelligente, l'interaction homme-machine, l'analyse sportive et d'autres domaines, ce qui peut considérablement améliorer le niveau d'intelligence des systèmes et l'expérience utilisateur.
Kinetics-400
MTV-H (WTS 60M)
Kinetics-600
MViT-B-24, 32x3
Charades
TokenLearner
Kinetics-700
MoViNet-A6
Toyota Smarthome dataset
π-ViT
AViD
TokenLearner
Moments in Time
ActivityNet-1.2
W-TALC
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
THUMOS’14
3C-Net
WiGesture
Kinetics-Sounds
MIT
InternVideo2-6B
TTStroke-21 ME22
RGB and PRGB
ActivityNet
UniFormerV2-L
BABEL
2s-AGCN
CelebV-HQ
Diving-48
DualPath w/ ViT-B/16
HMDB51
Jester test
MiniKinetics
MARS+RGB+Flow (16 frames)
Something-Something V2
AdaMAE
THUMOS'14
3C-Net
TTStroke-21 ME21
UCF101
Ours
YouCook2
VideoBERT (cross modal)