ضغط الشبكات العصبية ثلاثية الأبعاد باستخدام تحليل المصفوفة المتتالية

تم تطبيق الشبكات العصبية المُعَلَّمة بالتلويح الثلاثي الأبعاد (3DCNNs) في العديد من المهام، مثل التعرف على الفيديو والغيمات النقطية ثلاثية الأبعاد. ومع ذلك، بسبب البعد الأعلى للنواة التلافيفية، فإن التعقيد المكاني للشبكات العصبية المُعَلَّمة بالتلويح الثلاثي الأبعاد يكون عادةً أكبر من تعقيد الشبكات العصبية المُعَلَّمة بالتلويح الثنائية الأبعاد (2DCNNs). لتصغير الشبكات العصبية المُعَلَّمة بالتلويح الثلاثي الأبعاد لاستخدامها في بيئات محدودة مثل الأجهزة المدمجة، يعد ضغط الشبكة العصبية طريقة واعدة. في هذا العمل، نعتمد تحليل التنسور القطار (TT)، وهو طريقة ضغط تدريب حاضر بسيطة ومباشرة، لتصغير نماذج 3DCNN. من خلال اقتراح تحويل النوى التلافيفية ثلاثية الأبعاد إلى صيغة TT، ندرس كيفية اختيار الرتب المناسبة لـ TT لتحقيق نسبة ضغط أعلى. كما ناقشنا فائض النوى التلافيفية ثلاثية الأبعاد للضغط، أهمية النواة الأساسية واتجاهات المستقبل لهذا العمل، بالإضافة إلى التعقيد الحسابي النظرائي مقابل وقت التنفيذ العملي للتلافيف في صيغة TT. بناءً على عدة تجارب مقارنة باستخدام مجموعات البيانات VIVA Challenge وUCF11 وUCF101، نستنتج أن تحليل التنسور القطار يمكنه ضغط شبكات 3DCNN بمقدار حوالي مائة مرة دون فقدان دقيق كبير في الدقة، مما سيتيح استخدامها في سيناريوهات حقيقية واسعة النطاق.