HyperAIHyperAI
منذ 2 أشهر

تعلم الخصائص المكانية-الزمانية باستخدام شبكات الCONVOLUTIONAL ثلاثية الأبعاد

Du Tran; Lubomir Bourdev; Rob Fergus; Lorenzo Torresani; Manohar Paluri
تعلم الخصائص المكانية-الزمانية باستخدام شبكات الCONVOLUTIONAL ثلاثية الأبعاد
الملخص

نقترح نهجًا بسيطًا ولكنه فعال لتعلم الخصائص المكانية-الزمانية باستخدام شبكات الCONV ثلاثية الأبعاد (3D ConvNets) مدربة على مجموعة بيانات فيديو مشرف عليها على نطاق واسع. تتمثل نتائجنا في ثلاثة أمور: 1) أن شبكات الCONV ثلاثية الأبعاد أكثر ملاءمة لتعلم الخصائص المكانية-الزمانية مقارنة بشبكات الCONV ثنائية الأبعاد؛ 2) أن الهندسة المتجانسة ذات النوى المتكررة الصغيرة بحجم 3x3x3 في جميع الطبقات تعد من أفضل الهياكل لأداء شبكات الCONV ثلاثية الأبعاد؛ و3) أن خصائصنا التي تم تعلمها، والتي نطلق عليها اسم C3D (Convolutional 3D)، مع تصنيف خطي بسيط تتفوق على أحدث الأساليب في أربع مقاييس مختلفة وتكون مكافئة لأفضل الأساليب الحالية في المقاييس الأخرى اثنتين. بالإضافة إلى ذلك، فإن هذه الخصائص مضغوطة: حيث تحقق دقة بنسبة 52.8% على مجموعة بيانات UCF101 مع وجود فقط عشر أبعاد، كما أنها فعالة جدًا في الحساب بسبب الاستدلال السريع لشبكات الCONV. وأخيرًا، فهي بسيطة ومفهومة ومريحة للتدريب والاستخدام.

تعلم الخصائص المكانية-الزمانية باستخدام شبكات الCONVOLUTIONAL ثلاثية الأبعاد | أحدث الأوراق البحثية | HyperAI