HyperAIHyperAI
منذ 3 أشهر

W2F: إطار عمل من التدريب الضعيف إلى التدريب الكامل لكشف الكائنات

{Yongqiang Zhang, Yancheng Bai, Mingli Ding, Yongqiang Li, Bernard Ghanem}
W2F: إطار عمل من التدريب الضعيف إلى التدريب الكامل لكشف الكائنات
الملخص

حصل الكشف عن الكائنات المُراقبة بشكل ضعيف على اهتمام كبير مؤخرًا، نظرًا لعدم حاجته إلى تسميات مربعات حدودية (bounding box annotations) أثناء التدريب. وعلى الرغم من التقدم الكبير الذي تم تحقيقه، لا يزال هناك فجوة كبيرة في الأداء بين الكشف المُراقب بشكل ضعيف والكشف المُراقب بشكل كامل. في الآونة الأخيرة، استخدمت بعض الدراسات ما يُعرف بـ "الحقائق الافتراضية" (pseudo ground-truths)، التي تُولَّد بواسطة كاشف مُراقب بشكل ضعيف، لتدريب كاشف مُراقب بشكل كامل. وتُظهر هذه النهج ميلًا لاستكشاف أكثر الأجزاء تمثيلية للكائنات، وتسعى إلى تحديد صندوق حقيقي واحد فقط لكل فئة، حتى في حال وجود العديد من الكائنات من نفس الفئة. لتجاوز هذه المشكلات، نقترح إطار عمل يحول من الكشف المُراقب بشكل ضعيف إلى الكشف المُراقب بشكل كامل، حيث يتم تنفيذ الكاشف المُراقب بشكل ضعيف باستخدام تقنية التعلم عبر الأمثلة المتعددة (Multiple Instance Learning). ثم نقترح خوارزمية استكشاف الحقائق الافتراضية (Pseudo Ground-Truth Excavation, PGE) لتحديد الحقائق الافتراضية لكل كائن في الصورة. بالإضافة إلى ذلك، تم تصميم خوارزمية تكييف الحقائق الافتراضية (Pseudo Ground-Truth Adaptation, PGA) لتحسين هذه الحقائق الافتراضية الناتجة عن PGE بشكل إضافي. في النهاية، نستخدم هذه الحقائق الافتراضية لتدريب كاشف مُراقب بشكل كامل. أظهرت التجارب الواسعة على معايير PASCAL VOC 2007 و2012 الصعبة فعالية إطار العمل المقترح بشكل قوي. حيث حققنا تحسنًا ملحوظًا في الأداء، وبلغ متوسط الدقة (mAP) 52.4% على VOC2007 و47.8% على VOC2012، متفوّقين على أفضل الطرق السابقة في هذا المجال.