التعلم المتناقض المراقب بشكل ضعيف

لقد اكتسب التعلم غير المراقب لتمثيلات البصرية اهتمامًا كبيرًا من قبل مجتمع رؤية الحاسوب بسبب الإنجازات الأخيرة في التعلم المقارن. تعتمد معظم الأطر الحالية للتعلم المقارن على مهمة مسبقة لتمييز المثيلات (instance discrimination)، حيث تُعامل كل مثيل فردي على أنه فئة مختلفة. ومع ذلك، فإن هذا الأسلوب يُسبب بالضرورة مشكلة التصادم الفئوي (class collision)، مما يضر بجودة التمثيل المُتعلم. مستوحى من هذه الملاحظة، قمنا بتمثيل إطار عمل للتعلم المقارن غير المراقب الضعيف (WCL) لمعالجة هذه المشكلة. بشكل خاص، يعتمد الإطار المقترح على رأسين للتصدير، أحدهما يقوم بمهام تمييز المثيلات العادية. أما الرأس الآخر، فيستخدم طريقة قائمة على الرسوم البيانية لاستكشاف العينات المشابهة وإنشاء تسميات ضعيفة، ثم يُنفّذ مهمة تعلم مقارن مراقبة بناءً على هذه التسميات الضعيفة لجذب الصور المشابهة أقرب إلى بعضها. كما قمنا بإدخال استراتيجية متعددة القطع تعتمد على أقرب جيران (K-Nearest Neighbor) لتوسيع عدد العينات الموجبة. أظهرت النتائج التجريبية الواسعة أن WCL يُحسّن جودة التمثيلات ذاتية التعلم عبر مختلف المجموعات البيانات. وبشكل لافت، حققنا نتيجة جديدة من نوعها في التعلم شبه المراقب. وباستخدام فقط 1٪ و10٪ من الأمثلة المُعلّمة، تحقّق WCL دقة Top-1 على ImageNet تبلغ 65٪ و72٪ باستخدام ResNet50، وهي نتائج تفوق حتى نموذج SimCLRv2 باستخدام ResNet101.