التمايز الحركي للتعلم البصري للتمثيل غير المراقب

نقدّم "مُتَنَوِّرَة التَّقَرُّب" (Momentum Contrast - MoCo) لتعلم التمثيل البصري غير المُشرَّف. من منظور تعلّم التَّقَارُب كاسترجاع من قاموس، نبني قاموسًا ديناميكيًا باستخدام قائمة انتظار (queue) ومحوِّل مُعدَّل بوساطة متوسّطة متحركة. وهذا يمكّن من بناء قاموس كبير وثابت على الفور، ما يُسهّل تعلّم التَّقَارُب غير المُشرَّف. تُظهر MoCo نتائج تنافسية ضمن البروتوكول الخطي الشائع في تصنيف ImageNet. والأهم من ذلك، أن التمثيلات التي تعلّمتها MoCo تُحَوَّل بفعالية إلى المهام اللاحقة. ففي 7 مهام للكشف والتقسيم على مجموعات بيانات PASCAL VOC وCOCO وغيرها، يمكن لـ MoCo أن تتفوّق على نموذجها المُدرَّب بأسلوب مُشرَّف، أحيانًا بفارق كبير. هذا يشير إلى أن الفجوة بين تعلّم التمثيل غير المُشرَّف والمُشرَّف قد تقلّصت بشكل كبير في العديد من مهام الرؤية الحاسوبية.