الاستخلاص الذاتي الانتباه الشامل للكشف عن الكائنات بمنطق مراقبة ضعيفة

أصبح الكشف عن الكائنات المُراقبة ضعيفًا (WSOD) أداة فعالة لتدريب كاشفات الكائنات باستخدام علامات فئة الصورة فقط. ومع ذلك، وبسبب غياب العلامات على مستوى الكائن، فإن كاشفات WSOD عرضة للكشف عن مربعات حدودية حول الكائنات البارزة، والكائنات المجمعة، وأجزاء الكائن المميزة. علاوةً على ذلك، لا تفرض علامات الفئة على مستوى الصورة تجانسًا في كشف الكائنات عبر التحولات المختلفة للصور نفسها. ولحل هذه المشكلات، نقترح نهجًا تدريسيًا متكاملًا يُسمى "التمييز الذاتي بالانتباه الشامل" (CASD) لـ WSOD. ولتحقيق التوازن في تعلم الميزات بين جميع حالات الكائنات، يحسب CASD الانتباه الشامل المجمع من خلال عدة تحولات وطبقات ميزات للصور نفسها. ولضمان إشراف مكاني متسق على الكائنات، يقوم CASD بعملية التمييز الذاتي على شبكات WSOD، بحيث يتم تقريب الانتباه الشامل في آنٍ واحد من خلال عدة تحولات وطبقات ميزات للصور نفسها. وقد أنتج CASD نتائج متميزة على مستوى الحد الأقصى الحالي (SOTA) في معايير قياسية مثل PASCAL VOC 2007/2012 وMS-COCO.