إطار عمل بسيط للتعلم شبه المراقب للكشف عن الكائنات

يُعد التعلم شبه المُراقب (SSL) واعدًا في تحسين الأداء التنبؤي للنماذج المستندة إلى التعلم الآلي باستخدام البيانات غير المُعلمة. وعلى الرغم من التقدم المذهل الذي تم تحقيقه مؤخرًا، ظلت نطاقات العرض والتطبيق في مجال التعلم شبه المُراقب محدودة بشكل رئيسي بمهام تصنيف الصور. في هذا البحث، نقترح إطارًا فعّالًا ومبسطًا يُدعى STAC، مُصممًا للكشف عن الكائنات البصرية، إلى جانب استراتيجية لتحسين البيانات. يعتمد STAC على استخدام تسميات وهمية عالية الثقة للكائنات المحددة من صور غير مُعلمة، ويُحدّث النموذج من خلال فرض التماسك عبر استخدام عمليات تحسين قوية. كما نُقدّم بروتوكولات تجريبية لتقييم أداء الكشف عن الكائنات شبه المُراقب باستخدام مجموعة بيانات MS-COCO، ونُظهر فعالية STAC على كل من MS-COCO وVOC07. وعلى VOC07، يُحسّن STAC مؤشر AP$^{0.5}$ من 76.30 إلى 79.08؛ أما على MS-COCO، فيُظهر STAC كفاءة في استخدام البيانات تُضاعف مرتين، حيث يحقق 24.38 mAP باستخدام فقط 5% من البيانات المُعلمة، مُتفوّقًا على النموذج المُدرَّب بالكامل (المُراقب) الذي يحقق 23.86 mAP باستخدام 10% من البيانات المُعلمة. يُمكن الوصول إلى الكود عبر الرابط التالي: https://github.com/google-research/ssl_detection/.