HyperAIHyperAI
منذ 2 أشهر

إعادة النظر في هندسة Faster R-CNN لتحديد موقع الأنشطة الزمنية

Yu-Wei Chao; Sudheendra Vijayanarasimhan; Bryan Seybold; David A. Ross; Jia Deng; Rahul Sukthankar
إعادة النظر في هندسة Faster R-CNN لتحديد موقع الأنشطة الزمنية
الملخص

نقترح شبكة TAL-Net، وهي طريقة محسنة لتحديد موقع الأنشطة الزمنية في الفيديو مستوحاة من إطار الكشف عن الأشياء Faster R-CNN. تحل شبكة TAL-Net ثلاث مشكلات رئيسية في الأساليب الحالية: (1) نحسن مواءمة المجال الاستقبالي باستخدام بنية متعددة المقاييس يمكنها التعامل مع التباين الشديد في مدّة الأنشطة؛ (2) نستغل السياق الزمني للأعمال بشكل أفضل لكل من إنشاء الاقتراحات وتصنيف الأنشطة من خلال توسيع المجالات الاستقبالية بشكل مناسب؛ و(3) نعتبر صراحة دمج الميزات متعددة التدفقات ونبين أن دمج الحركة في وقت متأخر هو أمر مهم. نحقق أداءً رائدًا في كل من اقتراح الأنشطة وتخصيصها على مقاييس كشف THUMOS'14 وكفاءة تنافسية على تحدي ActivityNet.

إعادة النظر في هندسة Faster R-CNN لتحديد موقع الأنشطة الزمنية | أحدث الأوراق البحثية | HyperAI