منذ 8 أشهر

الملخص

يُعدّ "الرأس المشترك للتصنيف والتحديد المكاني" (الرأس الشقيق)، الذي تم تسميته لأول مرة في Fast R-CNN~\cite{girshick2015fast}، هو الأسلوب المهيمن في مجتمع كشف الكائنات خلال السنوات الخمس الماضية. يقدم هذا البحث ملاحظة تشير إلى أن التماسك المكاني غير الدقيق بين الوظيفتين الكائنتين في الرأس الشقيق يمكن أن يؤثر بشكل كبير على عملية التدريب، لكن يمكن التغلب على هذا التماسك من خلال عملية بسيطة جدًا تُسمى "الانفصال المكاني الواعي بالمهام" (TSD). وباعتبار التصنيف والانحدار، يُفصل TSD هاتين الوظيفتين من البُعد المكاني من خلال إنتاج اقتراحين منفصلين لهما، يتم تقديرهما باستخدام الاقتراح المشترك. ويستمد هذا التصميم إلهامه من ملاحظة طبيعية، تتمثل في أن ميزات منطقة بارزة معينة قد تحتوي على معلومات غنية للتصنيف، بينما قد تكون الميزات القريبة من الحدود مُلائمة جدًا لانحدار مربع الحدود (bounding box). بشكل مفاجئ، يمكن لهذا التصميم البسيط أن يُحسّن أداء جميع الهياكل العميقة (backbones) والنماذج على كل من مجموعتي بيانات MS COCO وGoogle OpenImage بشكل متسق بحوالي 3% في مقياس mAP. علاوةً على ذلك، نقترح قيدًا تدريجيًا لتوسيع الفجوة الأداء بين الاقتراحات المنفصلة والاقتراح المشترك، مما يُحقق مكسبًا إضافيًا قدره حوالي 1% في mAP. ونُظهر أن النموذج المُقدّم يكسر بوضوح الحد الأقصى الحالي للنماذج الفردية في كشف الكائنات (بمعدل mAP 49.4 باستخدام ResNet-101، و51.2 باستخدام SENet154)، وهو أيضًا النموذج الأساسي في حلّنا الحائز على المركز الأول في مسابقة Google OpenImage Challenge 2019.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار