Action Recognition
تخصيص الأنشطة الزمنية هو جزء فرعي من مجال الرؤية الحاسوبية يهدف إلى الكشف عن الأنشطة داخل تدفقات الفيديو وإخراج أوقات بدايتها ونهايتها. يوفر هذا المهمة دعمًا حاسمًا للتطبيقات مثل تحليل الفيديو والمراقبة واسترجاع المحتوى من خلال تحديد دقيق لوقت حدوث الأنشطة في الفيديو. وهو مرتبط ارتباطًا وثيقًا بتوليد مقترحات الأنشطة الزمنية، مما يمكنه من تعزيز دقة وكفاءة فهم الفيديو بشكل فعال.
ActivityNet-1.2
DeepMetricLearner
ActivityNet-1.3
AVFusion
CrossTask
VideoCLIP
Ego4D MQ test
ActionFormer (SlowFast+Omnivore+EgoVLP)
Ego4D MQ val
EPIC-KITCHENS-100
AdaTAD (verb, VideoMAE-L)
FineAction
VideoMAE V2-g
HACS
RDFA-S6 (InternVideo2-6B)
MEXaction2
S-CNN
MultiTHUMOS
TriDet (VideoMAEv2)
MUSES
TemporalMaxer
THUMOS'14
AVFusion
THUMOS’14
ActionFormer (VideoMAE V2-g features)
THUMOS14
BasicTAD (R50-SlowOnly)