منذ 2 أشهر
ملاحظة قصيرة حول كينيتيكس-600
Joao Carreira; Eric Noland; Andras Banki-Horvath; Chloe Hillier; Andrew Zisserman

الملخص
نقوم بوصف توسيع مجموعة بيانات DeepMind Kinetics للفعل البشري من 400 فئة، كل منها يحتوي على ما لا يقل عن 400 مقطع فيديو، إلى 600 فئة، كل منها يحتوي على ما لا يقل عن 600 مقطع فيديو. لتوسيع المجموعة، قمنا بتغيير عملية جمع البيانات بحيث تستخدم استعلامات متعددة لكل فئة، وبعض هذه الاستعلامات بلغة أخرى غير الإنجليزية -- البرتغالية. يتضمن هذا البحث التفاصيل حول التغييرات بين النسختين من المجموعة ويشمل مجموعة شاملة من الإحصائيات للنسخة الجديدة بالإضافة إلى نتائج الأساس باستخدام بنية الشبكة العصبية I3D (I3D Neural Network Architecture). يعتبر هذا البحث مرافقًا لإصدار علامات الحقيقة الأرضية لمجموعة الاختبار العامة.