Consistent-Teacher: نحو تقليل الأهداف الافتراضية غير المتسقة في الكشف عن الكائنات شبه المراقبة

في هذه الدراسة، نتعمق في عدم اتساق الأهداف الوهمية في كشف الكائنات القائم على التعلم شبه المراقب (SSOD). ملاحظتنا الأساسية هي أن الأهداف الوهمية المتذبذبة تُضعف عملية تدريب كاشف دقيق، حيث تُضخم الضوضاء في تدريب الشبكة الطالبة، مما يؤدي إلى مشكلات شديدة في التعلم الزائد (overfitting). لذلك، نقترح حلًا منهجيًا يُسمى ConsistentTeacher لتقليل هذا عدم الاتساق. أولاً، يُستبدل الاستراتيجية الثابتة القائمة على معامل IoU بتعيين محاور تكيفية (ASA)، مما يُمكّن الشبكة الطالبة من مقاومة الصور الوهمية الملوثة بالضوضاء. ثانيًا، نُعدّل توقعات المهام الفرعية من خلال تصميم وحدة محاذاة الميزات ثلاثية الأبعاد (FAM-3D)، والتي تسمح لكل ميزة تصنيفية بالاستعلام التكيفي عن المتجه المثالي للميزة لمهام التصحيح عند أي مقياس أو موقع. أخيرًا، تُستخدم نموذج المزيج الغاوسي (GMM) لإعادة تعديل حد التصنيف للصورة الوهمية بشكل ديناميكي، مما يُثبّت عدد العناصر الحقيقية (ground truths) في المراحل المبكرة، ويُصلح إشارة الإشراف غير الموثوقة أثناء التدريب. يُظهر ConsistentTeacher نتائج قوية في مجموعة واسعة من تقييمات SSOD. حيث يحقق 40.0 mAP باستخدام هيكل ResNet-50 مع 10% فقط من بيانات MS-COCO المُعلمة، متفوقًا على النماذج السابقة التي تعتمد على العلامات الوهمية بحوالي 3 mAP. وعند التدريب على بيانات MS-COCO الكاملة المُعلمة مع إضافة بيانات غير مُعلمة، ترتفع الأداء إلى 47.7 mAP. يُمكن الوصول إلى الكود الخاص بنا عبر الرابط: \url{https://github.com/Adamdad/ConsistentTeacher}.