HyperAIHyperAI
منذ 2 أشهر

التحولات الباقية المجمعة للشبكات العصبية العميقة

Saining Xie; Ross Girshick; Piotr Dollár; Zhuowen Tu; Kaiming He
التحولات الباقية المجمعة للشبكات العصبية العميقة
الملخص

نقدم معمارية شبكة بسيطة وعالية التقسيم للتصنيف الصوري. يتم بناء شبكتنا بتكرار وحدة بنائية تجمع مجموعة من التحولات ذات التوبولوجيا نفسها. ينتج عن تصميمنا البسيط معمارية متعددة الفروع والمتجانسة والتي تحتوي على عدد قليل فقط من المعلمات الفائقة لضبطها. هذه الاستراتيجية تكشف عن بعد جديد، والذي نسميه "العددية" (حجم مجموعة التحولات)، كعامل أساسي بالإضافة إلى أبعاد العمق والعرض. على مجموعة بيانات ImageNet-1K، نظهر بالتجربة أن زيادة العددية يمكن أن تحسن دقة التصنيف حتى في ظل شرط الاحتفاظ بالتعقيد. علاوة على ذلك، فإن زيادة العددية أكثر فعالية من الذهاب إلى أعماق أكبر أو عرض أوسع عندما نزيد السعة. نُطلق على نماذجنا اسم ResNeXt، وهي أساس مشاركتنا في مهمة تصنيف ILSVRC 2016 حيث حصلنا على المركز الثاني. قدمنا أيضًا دراسة إضافية لنماذج ResNeXt على مجموعة بيانات ImageNet-5K ومجموعة بيانات COCO للكشف، وأظهرت أيضًا نتائج أفضل من نظيرتها ResNet. الكود والنماذج متوفّران بشكل عام عبر الإنترنت.

التحولات الباقية المجمعة للشبكات العصبية العميقة | أحدث الأوراق البحثية | HyperAI