HyperAIHyperAI

Command Palette

Search for a command to run...

إعادة النظر في رأس الأشقاء في كاشف الكائنات

Guanglu Song Yu Liu Xiaogang Wang

الملخص

يُعدّ "الرأس المشترك للتصنيف والتحديد المكاني" (الرأس الشقيق)، الذي تم تسميته لأول مرة في Fast R-CNN~\cite{girshick2015fast}، هو الأسلوب المهيمن في مجتمع كشف الكائنات خلال السنوات الخمس الماضية. يقدم هذا البحث ملاحظة تشير إلى أن التماسك المكاني غير الدقيق بين الوظيفتين الكائنتين في الرأس الشقيق يمكن أن يؤثر بشكل كبير على عملية التدريب، لكن يمكن التغلب على هذا التماسك من خلال عملية بسيطة جدًا تُسمى "الانفصال المكاني الواعي بالمهام" (TSD). وباعتبار التصنيف والانحدار، يُفصل TSD هاتين الوظيفتين من البُعد المكاني من خلال إنتاج اقتراحين منفصلين لهما، يتم تقديرهما باستخدام الاقتراح المشترك. ويستمد هذا التصميم إلهامه من ملاحظة طبيعية، تتمثل في أن ميزات منطقة بارزة معينة قد تحتوي على معلومات غنية للتصنيف، بينما قد تكون الميزات القريبة من الحدود مُلائمة جدًا لانحدار مربع الحدود (bounding box). بشكل مفاجئ، يمكن لهذا التصميم البسيط أن يُحسّن أداء جميع الهياكل العميقة (backbones) والنماذج على كل من مجموعتي بيانات MS COCO وGoogle OpenImage بشكل متسق بحوالي 3% في مقياس mAP. علاوةً على ذلك، نقترح قيدًا تدريجيًا لتوسيع الفجوة الأداء بين الاقتراحات المنفصلة والاقتراح المشترك، مما يُحقق مكسبًا إضافيًا قدره حوالي 1% في mAP. ونُظهر أن النموذج المُقدّم يكسر بوضوح الحد الأقصى الحالي للنماذج الفردية في كشف الكائنات (بمعدل mAP 49.4 باستخدام ResNet-101، و51.2 باستخدام SENet154)، وهو أيضًا النموذج الأساسي في حلّنا الحائز على المركز الأول في مسابقة Google OpenImage Challenge 2019.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp