Command Palette
Search for a command to run...
إعادة النظر في رأس الأشقاء في كاشف الكائنات
إعادة النظر في رأس الأشقاء في كاشف الكائنات
Guanglu Song Yu Liu Xiaogang Wang
الملخص
يُعدّ "الرأس المشترك للتصنيف والتحديد المكاني" (الرأس الشقيق)، الذي تم تسميته لأول مرة في Fast R-CNN~\cite{girshick2015fast}، هو الأسلوب المهيمن في مجتمع كشف الكائنات خلال السنوات الخمس الماضية. يقدم هذا البحث ملاحظة تشير إلى أن التماسك المكاني غير الدقيق بين الوظيفتين الكائنتين في الرأس الشقيق يمكن أن يؤثر بشكل كبير على عملية التدريب، لكن يمكن التغلب على هذا التماسك من خلال عملية بسيطة جدًا تُسمى "الانفصال المكاني الواعي بالمهام" (TSD). وباعتبار التصنيف والانحدار، يُفصل TSD هاتين الوظيفتين من البُعد المكاني من خلال إنتاج اقتراحين منفصلين لهما، يتم تقديرهما باستخدام الاقتراح المشترك. ويستمد هذا التصميم إلهامه من ملاحظة طبيعية، تتمثل في أن ميزات منطقة بارزة معينة قد تحتوي على معلومات غنية للتصنيف، بينما قد تكون الميزات القريبة من الحدود مُلائمة جدًا لانحدار مربع الحدود (bounding box). بشكل مفاجئ، يمكن لهذا التصميم البسيط أن يُحسّن أداء جميع الهياكل العميقة (backbones) والنماذج على كل من مجموعتي بيانات MS COCO وGoogle OpenImage بشكل متسق بحوالي 3% في مقياس mAP. علاوةً على ذلك، نقترح قيدًا تدريجيًا لتوسيع الفجوة الأداء بين الاقتراحات المنفصلة والاقتراح المشترك، مما يُحقق مكسبًا إضافيًا قدره حوالي 1% في mAP. ونُظهر أن النموذج المُقدّم يكسر بوضوح الحد الأقصى الحالي للنماذج الفردية في كشف الكائنات (بمعدل mAP 49.4 باستخدام ResNet-101، و51.2 باستخدام SENet154)، وهو أيضًا النموذج الأساسي في حلّنا الحائز على المركز الأول في مسابقة Google OpenImage Challenge 2019.