منذ 2 أشهر
شبكات SlowFast لتمييز الفيديو
Christoph Feichtenhofer; Haoqi Fan; Jitendra Malik; Kaiming He

الملخص
نقدم شبكات SlowFast للاعتراف بالفيديو. نموذجنا يشمل (أ) مسارًا بطيئًا يعمل بمعدل إطار منخفض لالتقاط الدلالات المكانية، و(ب) مسارًا سريعًا يعمل بمعدل إطار مرتفع لالتقاط الحركة بدقة زمنية دقيقة. يمكن جعل المسار السريع خفيف الوزن للغاية عن طريق تقليل قدرة القنوات الخاصة به، ومع ذلك يمكنه تعلم معلومات زمنية مفيدة للاعتراف بالفيديو. تحقق نماذجنا أداءً قويًا في تصنيف الأفعال وكشفها في الفيديو، وتُعزى التحسينات الكبيرة إلى مفهوم SlowFast الخاص بنا. نبلغ عن دقة رائدة في مجال الاعتراف بالفيديو على مقاييس Kinetics وCharades وAVA الرئيسية. تم توفير الرموز البرمجية في: https://github.com/facebookresearch/SlowFast