Action Classification
تصنيف الأنشطة هو مهمة فرعية مهمة في مجال الرؤية الحاسوبية، يركز على التعرف وتصنيف الأنشطة البشرية في مقاطع الفيديو. تهدف هذه المهمة إلى تصنيف أنواع مختلفة من الأنشطة بدقة في فئات محددة مسبقًا من خلال تحليل الخصائص الديناميكية في سلاسل الفيديو، مما يحقق فهمًا آليًا لأنشطة الإنسان. قيمتها التطبيقية واسعة، وتتضمن ولكن لا تقتصر على المراقبة الذكية، والتفاعل بين الإنسان والحاسوب، وتحليل الرياضات، وغيرها من المجالات، والتي يمكن أن تساهم بشكل كبير في رفع مستوى ذكاء الأنظمة وتحسين تجربة المستخدم.
ActivityNet
UniFormerV2-L
ActivityNet-1.2
W-TALC
AViD
TokenLearner
BABEL
2s-AGCN
CelebV-HQ
Charades
TokenLearner
Diving-48
DualPath w/ ViT-B/16
HMDB51
Jester test
Kinetics-400
InternVideo
Kinetics-600
MViT-L (train from scratch)
Kinetics-700
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
Kinetics-Sounds
MiniKinetics
MARS+RGB+Flow (16 frames)
MIT
InternVideo2-6B
Moments in Time
Something-Something V2
AdaMAE
THUMOS'14
3C-Net
THUMOS’14
3C-Net
Toyota Smarthome dataset
π-ViT
TTStroke-21 ME22
RGB and PRGB
TTStroke-21 ME21
UCF101
Ours
WiGesture
YouCook2
VideoBERT (cross modal)
MoViNet-A6