HyperAIHyperAI
منذ 2 أشهر

خط أساس أفضل لـ AVA

Rohit Girdhar; João Carreira; Carl Doersch; Andrew Zisserman
خط أساس أفضل لـ AVA
الملخص

نقدم نموذجًا أساسيًا بسيطًا لتحديد موقع الإجراءات على مجموعة بيانات AVA. يعتمد هذا النموذج على إطار الكشف عن الصندوق المحيط الأسرع R-CNN، مع تعديل ليتم تشغيله باستخدام الخصائص المكانية-الزمانية البحتة - في حالتنا يتم إنتاجها بشكل حصري بواسطة نموذج I3D مُدرب مسبقًا على Kinetics. يحقق هذا النموذج نسبة AP المتوسطة 21.9% على مجموعة التحقق من صحة AVA الإصدار 2.1، مقارنة بنسبة 14.5% للنموذج المكاني-الزماني RGB الأفضل المستخدم في ورقة AVA الأصلية (الذي تم تدريبه مسبقًا على Kinetics و ImageNet)، ومقارنة بنسبة 11.3% للنموذج الأساسي المتاح علنًا الذي يستخدم مستخرج خصائص الصور ResNet101 (المُدرب مسبقًا على ImageNet). يحصل نموذجنا النهائي على نسبة mAP 22.8%/21.9% في مجموعات التحقق من صحة الاختبار والاختبار، ويتفوق على جميع المشاركات في تحدي AVA في مؤتمر CVPR 2018.