استخدام عدم الاستقرار في الكشف عن الأشياء برقابة ضعيفة

الكشف عن الأشياء تحت الإشراف الضعيف (WSOD) يركز على تدريب كاشف الأشياء باستخدام شروح صورية فقط، وهو أمر مثير للتحدي بسبب الفجوة بين الإشراف والهدف. معظم النهج الحالية تُنمذج WSOD كمشكلة تعلم متعدد الحالات (MIL). ومع ذلك، نلاحظ أن نتيجة الكاشف المستند إلى MIL غير مستقرة، أي أن الصناديق الحدودية الأكثر ثقة تتغير بشكل كبير عند استخدام مبادرات مختلفة. نقوم بقياس عدم الاستقرار بشكل كمي من خلال تقديم مؤشر لقياسه وتحليل السبب وراء عدم الاستقرار بطريقة تجريبية. رغم أن عدم الاستقرار يبدو ضارًا للمهمة الكشفية، فإننا نجادل بأن يمكن استغلاله لتحسين الأداء من خلال دمج نتائج الكاشفات المبادرة بطرق مختلفة. لتنفيذ هذه الفكرة، نقترح إطارًا شاملًا يتضمن فروع كشف متعددة، ونقدم استراتيجية دمج بسيطة. كما نقترح طريقة تمهيد متعامدة لزيادة الاختلاف بين فروع الكشف. من خلال استغلال عدم الاستقرار، حققنا نسبة mAP قدرها 52.6٪ و48.0٪ على مجموعتي البيانات PASCAL VOC 2007 و2012 الصعبتين، وهي أعلى النسب في هذا المجال حتى الآن.