
نقترح بنية شبكة عميقة جديدة تُسمى "شبكة داخل شبكة" (Network In Network - NIN) لتعزيز قدرة النموذج على التمييز بين الرقع المحلية ضمن المجال الاستقبالي. يستخدم الطبقة التقليدية للشبك العصبي المتشابك (CNN) مرشحات خطية متبوعة بدالة تنشيط غير خطية لمسح الإدخال. بدلاً من ذلك، نقوم ببناء شبكات عصبية صغيرة ذات هياكل أكثر تعقيدًا لتجريد البيانات داخل المجال الاستقبالي. نطبق الشبكة العصبية الصغيرة باستخدام مُعرِّف وظيفي قوي هو الـ "مُعَالِج متعدد الطبقات" (Multilayer Perceptron). يتم الحصول على الخرائط المميزة عن طريق تمرير الشبكات الصغيرة فوق الإدخال بطريقة مشابهة لـ CNN؛ ثم يتم إدخالها إلى الطبقة التالية. يمكن تنفيذ الشبكة العميقة NIN من خلال تراكيب العديد من الهياكل الموصوفة أعلاه. بفضل التحسين المحلي الأفضل عبر الشبكة الصغيرة، نتمكن من استخدام التجميع المتوسط العالمي على الخرائط المميزة في طبقة التصنيف، وهو أسهل في الفهم وأقل عرضة للتضخيم الزائد مقارنة بالطبقات المتصلة بالكامل التقليدية. أظهرنا أفضل الأداء في تصنيفات NIN على مجموعتي بيانات CIFAR-10 وCIFAR-100، وأداءً معقولًا على مجموعتي بيانات SVHN وMNIST.