Action Classification
Action Classification是计算机视觉领域的一个重要子任务,专注于识别和分类视频中的人类行为动作。该任务旨在通过分析视频序列中的动态特征,准确地将不同类型的动作归类到预定义的类别中,从而实现对人类活动的自动理解。其应用价值广泛,包括但不限于智能监控、人机交互、体育分析等领域,能够显著提升系统的智能化水平和用户体验。
ActivityNet
UniFormerV2-L
ActivityNet-1.2
W-TALC
AViD
TokenLearner
BABEL
2s-AGCN
CelebV-HQ
Charades
TokenLearner
Diving-48
DualPath w/ ViT-B/16
HMDB51
Jester test
Kinetics-400
InternVideo
Kinetics-600
MViT-L (train from scratch)
Kinetics-700
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
Kinetics-Sounds
MiniKinetics
MARS+RGB+Flow (16 frames)
MIT
InternVideo2-6B
Moments in Time
Something-Something V2
AdaMAE
THUMOS'14
3C-Net
THUMOS’14
3C-Net
Toyota Smarthome dataset
π-ViT
TTStroke-21 ME22
RGB and PRGB
TTStroke-21 ME21
UCF101
Ours
WiGesture
YouCook2
VideoBERT (cross modal)
MoViNet-A6