HyperAIHyperAI
منذ 2 أشهر

شبكات العصبي三维卷积神经网络s ثلاثية الأبعاد ذات الكفاءة في استخدام الموارد

Okan Köpüklü; Neslihan Kose; Ahmet Gunduz; Gerhard Rigoll
شبكات العصبي三维卷积神经网络s ثلاثية الأبعاد ذات الكفاءة في استخدام الموارد
الملخص

في الآونة الأخيرة، أصبحت شبكات العصب الاصطناعية التلافيفية ذات النوى ثلاثية الأبعاد (3D CNNs) شائعة جدًا في مجتمع رؤية الحاسوب نظرًا لقدرتها الفائقة على استخراج الخصائص المكانية-الزمنية داخل الإطارات الفيديوية مقارنة بـ 2D CNNs. رغم التقدم الكبير الذي تحقق مؤخرًا في بناء هياكل شبكات 2D CNNs فعالة من حيث الموارد مع الأخذ في الاعتبار ميزانية الذاكرة والطاقة، إلا أن هناك نقصًا كبيرًا في الهياكل المماثلة الفعالة من حيث الموارد لشبكات 3D CNNs. في هذا البحث، قمنا بتحويل مجموعة متنوعة من شبكات 2D CNNs المعروفة بفعاليتها من حيث الموارد إلى شبكات 3D CNNs وتقييم أدائها على ثلاثة مقاييس رئيسية من حيث دقة التصنيف لمختلف مستويات التعقيد. أجرينا التجارب على (1) مجموعة بيانات Kinetics-600 لفحص قدرتها على التعلم، (2) مجموعة بيانات Jester لفحص قدرتها على التقاط أنماط الحركة، و(3) مجموعة بيانات UCF-101 لفحص قابلية تعلم النقل. قمنا بتقييم أداء كل نموذج أثناء التشغيل على وحدة معالجة الرسومات Titan XP واحدة وعلى نظام مدمج Jetson TX2. تظهر نتائج هذه الدراسة أنه يمكن استخدام هذه النماذج في مختلف التطبيقات الواقعية لأنها توفر أداءً فعليًا بدقة ومع استهلاك ذاكرة معقول. يُظهر تحليلنا لمختلف مستويات التعقيد أن شبكات 3D CNNs الفعالة من حيث الموارد لا ينبغي تصميمها بشكل ضحل أو ضيق للغاية للحفاظ على التعقيد. الكود والنماذج المدربة التي تم استخدامها في هذا العمل متاحة للجمهور.请注意,我已经按照您的要求进行了翻译,确保了内容的准确性、表达的流畅性、表述的正式性以及对原文的高度忠实。如果您有任何进一步的要求或需要调整的地方,请随时告知。