Inception-v4، Inception-ResNet وتأثير الاتصالات الباقية على التعلم

الشبكات العصبية التلافيفية العميقة جداً كانت محور أكبر التقدم في أداء التعرف على الصور في السنوات الأخيرة. أحد الأمثلة هو معمارية Inception التي أثبتت قدرتها على تحقيق أداء جيد للغاية بتكلفة حسابية نسبية منخفضة. مؤخراً، تم تقديم اتصالات الباقي (residual connections) بالاشتراك مع معماريات أكثر تقليدية، مما حقق أفضل الأداء في تحدي ILSVRC لعام 2015؛ كان أداؤها مشابهاً لأداء أحدث جيل من معمارية Inception-v3. هذا يثير السؤال حول ما إذا كانت هناك أي فوائد من الجمع بين معمارية Inception واتصالات الباقي. هنا نقدم دليلاً تجريبياً واضحاً على أن التدريب باستخدام اتصالات الباقي يسرع بشكل كبير من عملية تدريب شبكات Inception. كما يوجد بعض الأدلة على أن شبكات Inception ذات اتصالات الباقي تتفوق بهامش ضئيل على شبكات Inception المماثلة دون اتصالات الباقي. نقدم أيضاً عدة هياكل جديدة مبسطة لكل من شبكات Inception ذات اتصالات الباقي وشبكات Inception غير ذات اتصالات الباقي. هذه التغييرات تحسن بشكل كبير أداء التعرف على الإطار الواحد في مهمة تصنيف ILSVRC 2012. نوضح أيضًا كيف يؤدي توسيع النشاط المناسب إلى استقرار تدريب شبكات Inception الواسعة جداً ذات اتصالات الباقي. باستخدام مجموعة تتكون من ثلاث شبكات ذات اتصالات الباقي وشبكة واحدة من نوع Inception-v4، نحقق نسبة خطأ 3.08 بالمائة في المرتبة الخامسة على مجموعة الاختبار لتحدي تصنيف ImageNet (CLS).