MicronNet: معماريات شبكات العصبونات العميقة المضغوطة للغاية لتصنيف علامات المرور في الوقت الحقيقي المدمجة

التعرف على إشارات المرور هو مهمة رؤية حاسوبية مهمة للغاية لعدد من التطبيقات الحقيقية مثل مراقبة وتحليل النقل الذكي. رغم أن الشبكات العصبية العميقة أثبتت في السنوات الأخيرة قدرتها على تقديم أداء متميز في التعرف على إشارات المرور، فإن التحدي الرئيسي لتمكين نشر هذه الشبكات بشكل واسع في الأجهزة المدمجة هو متطلبات الحوسبة والذاكرة العالية لهذه الشبكات. نتيجة لذلك، هناك فوائد كبيرة في دراسة هياكل شبكات عصبية عميقة مدمجة تتناسب بشكل أفضل مع الأجهزة المدمجة. في هذا البحث، نقدم MicronNet (مايكروننت)، وهي شبكة عصبية دائرية عميقة ومدمجة للغاية تم تصميمها بناءً على مبادئ تصميم الهيكل الكلي (مثل تعزيز الهيكل الكلي الطيفي، تحسين دقة المعلمات، إلخ) بالإضافة إلى استراتيجيات تحسين الهيكل الجزئي العددي. وبالتالي، يتم تصميم هيكل MicronNet الإجمالي بقدر أقل من المعلمات والحسابات قدر الإمكان مع الحفاظ على أداء التعرف، مما يؤدي إلى كثافة المعلومات المحسنة للشبكة المقترحة. يمتلك MicronNet النموذجي حجمًا يبلغ حوالي 1 ميجابايت وحوالي 510,000 معلمة (حوالي 27 مرة أقل من أفضل التقنيات المتاحة حاليًا) بينما لا يزال يحقق دقة تصنيف أولى تبلغ 98.9٪ على مقاييس التعرف على إشارات المرور الألمانية. بالإضافة إلى ذلك، يحتاج MicronNet إلى حوالي 10 مليون عملية ضرب وإضافة فقط لأداء الاستدلال، ولديه وقت حساب يبلغ حوالي 32.19 ملي ثانية على معالج Cortex-A53 ذي الكفاءة العالية. تظهر هذه النتائج التجريبية أنه يمكن تصميم هياكل شبكات عصبية عميقة ومدمجة ومُحسَّنة للأداء للاستخدام الفعلي في التعرف على إشارات المرور والتي تناسب السيناريوهات المدمجة بشكل جيد.