منذ 2 أشهر
إعادة النظر في هندسة Faster R-CNN لتحديد موقع الأنشطة الزمنية
Yu-Wei Chao; Sudheendra Vijayanarasimhan; Bryan Seybold; David A. Ross; Jia Deng; Rahul Sukthankar

الملخص
نقترح شبكة TAL-Net، وهي طريقة محسنة لتحديد موقع الأنشطة الزمنية في الفيديو مستوحاة من إطار الكشف عن الأشياء Faster R-CNN. تحل شبكة TAL-Net ثلاث مشكلات رئيسية في الأساليب الحالية: (1) نحسن مواءمة المجال الاستقبالي باستخدام بنية متعددة المقاييس يمكنها التعامل مع التباين الشديد في مدّة الأنشطة؛ (2) نستغل السياق الزمني للأعمال بشكل أفضل لكل من إنشاء الاقتراحات وتصنيف الأنشطة من خلال توسيع المجالات الاستقبالية بشكل مناسب؛ و(3) نعتبر صراحة دمج الميزات متعددة التدفقات ونبين أن دمج الحركة في وقت متأخر هو أمر مهم. نحقق أداءً رائدًا في كل من اقتراح الأنشطة وتخصيصها على مقاييس كشف THUMOS'14 وكفاءة تنافسية على تحدي ActivityNet.