اكتشاف الأشياء عبر التعلم التبايني للكشف عن الأشياء برقابة ضعيفة

الكشف عن الأشياء تحت الإشراف الضعيف (WSOD) هو مهمة تهدف إلى اكتشاف الأشياء في الصورة باستخدام نموذج تم تدريبه فقط على شروحات على مستوى الصورة. النماذج الرائدة حاليًا تستفيد من الإشراف الذاتي على مستوى المثال، ولكن بما أن الإشراف الضعيف لا يشمل معلومات العدد أو الموقع، فإن طريقة التسمية الأكثر شيوعًا "أرجماكس" غالبًا ما تتجاهل العديد من حالات وجود الأشياء. لحل هذه المشكلة، نقترح طريقة جديدة للتسمية متعددة الأمثلة تُعرف باكتشاف الأشياء. كما نقدم دالة خسارة مقارنة جديدة تحت الإشراف الضعيف حيث لا تكون هناك معلومات على مستوى المثال متاحة للعينة، وتُسمى دالة الخسارة المقارنة تحت الإشراف الضعيف (WSCL). تهدف WSCL إلى بناء حد موثوق به للتشابه لاكتشاف الأشياء من خلال الاستفادة من الخصائص الثابتة لمتجهات التضمين في نفس الفئة. نتيجة لذلك، حققنا نتائجًا رائدة جديدة على MS-COCO 2014 و2017 وكذلك PASCAL VOC 2012، ونتائج تنافسية على PASCAL VOC 2007.