C-MIL: التعلم متعدد الحالات المستمر للكشف عن الأشياء برقابة ضعيفة

الكشف عن الأشياء تحت الإشراف الضعيف (WSOD) هو مهمة صعبة عندما يتم توفير إشراف على فئات الصور ولكن يتطلب تعلم مواقع الأشياء وكشفها في الوقت نفسه. تتبنى العديد من نهج WSOD التعلم متعدد النماذج (MIL) ولديها دوال خسارة غير محدبة تكون عرضة للوقوع في الحدود الدنيا المحلية (تحديد أجزاء الخاطئة من الأشياء) أثناء تفويت نطاق الشيء الكامل خلال التدريب. في هذا البحث، نقدم طريقة الأمثلة المستمرة إلى MIL وننشئ بالتالي التعلم متعدد النماذج المستمر (C-MIL)، بقصد تخفيف مشكلة عدم المحدبية بطريقة منهجية. نقسم النماذج إلى مجموعات مرتبطة مكانياً ومجموعات مرتبطة بالفئة، ونقترب من دالة الخسارة الأصلية بمجموعة من دوال الخسارة المُستوية المعرفة داخل هذه المجموعات. يمنع تحسين دوال الخسارة المستوية إيقاع عملية التدريب في الحدود الدنيا المحلية بشكل مبكر ويسهل اكتشاف المناطق المتطرفة الدلالية المستقرة (SSERs) التي تشير إلى نطاق الشيء الكامل. على مجموعتي البيانات PASCAL VOC 2007 و2012، يحسن C-MIL الحالة الفنية للكشف عن الأشياء تحت الإشراف الضعيف والتحديد الضعيف لمواقع الأشياء بمargins كبيرة.注:在最后一句中,“margins”一词在阿拉伯语中没有直接对应的术语,因此保留了英文原词。如果需要更具体的翻译,可以将其翻译为“هامش كبير”或根据上下文调整为“بفارق كبير”。