تحليل الثباتية في القياس في اكتشاف الأشياء - SNIP

يُقدَّم تحليل لتقنيات مختلفة للاعتراف و الكشف عن الأشياء تحت تغيرات مقياس شديدة. يتم مقارنة تصميم المكتشفات المحدد بالمقياس والثابت للمقياس من خلال تدريبها باستخدام تكوينات مختلفة للبيانات الإدخال. من خلال تقييم أداء هياكل الشبكة المختلفة في تصنيف الأشياء الصغيرة على ImageNet، نظهر أن شبكات الاعصاب التلافيفية (CNNs) ليست مقاومة للتغيرات في المقياس. بناءً على هذا التحليل، نقترح تدريب واختبار المكتشفات على نفس مقاييس الهرم الصوري. بما أن الأشياء الصغيرة والكبيرة تكون صعبة الاعتراف بها عند المقاييس الأصغر والأكبر على التوالي، نقدم مخطط تدريب جديد يُسمى "تطبيع المقياس للهرم الصوري" (Scale Normalization for Image Pyramids - SNIP)، والذي يقوم بانتقاء رجوع التدرجات للحالات الشيء حسب مقياس الصورة. على مجموعة بيانات COCO، يكون أداء نموذجنا الفردي 45.7٪، بينما تحصل مجموعة من 3 شبكات على دقة متوسطة (mAP) قدرها 48.3٪. نستخدم نماذج تم تدريبها مسبقًا على ImageNet-1000 جاهزة للاستخدام ونقوم بالتدريب فقط باستخدام إشراف الحدود المرسومة (bounding box supervision). فازت مشاركتنا بجائزة أفضل مشروع طلابي في تحدي COCO لعام 2017. سيتم توفير الرمز البرمجي في \url{http://bit.ly/2yXVg4c}.