Command Palette
Search for a command to run...
خط أساس أفضل لـ AVA
خط أساس أفضل لـ AVA
Rohit Girdhar João Carreira Carl Doersch Andrew Zisserman
الملخص
نقدم نموذجًا أساسيًا بسيطًا لتحديد موقع الإجراءات على مجموعة بيانات AVA. يعتمد هذا النموذج على إطار الكشف عن الصندوق المحيط الأسرع R-CNN، مع تعديل ليتم تشغيله باستخدام الخصائص المكانية-الزمانية البحتة - في حالتنا يتم إنتاجها بشكل حصري بواسطة نموذج I3D مُدرب مسبقًا على Kinetics. يحقق هذا النموذج نسبة AP المتوسطة 21.9% على مجموعة التحقق من صحة AVA الإصدار 2.1، مقارنة بنسبة 14.5% للنموذج المكاني-الزماني RGB الأفضل المستخدم في ورقة AVA الأصلية (الذي تم تدريبه مسبقًا على Kinetics و ImageNet)، ومقارنة بنسبة 11.3% للنموذج الأساسي المتاح علنًا الذي يستخدم مستخرج خصائص الصور ResNet101 (المُدرب مسبقًا على ImageNet). يحصل نموذجنا النهائي على نسبة mAP 22.8%/21.9% في مجموعات التحقق من صحة الاختبار والاختبار، ويتفوق على جميع المشاركات في تحدي AVA في مؤتمر CVPR 2018.