MutexMatch: التعلم شبه المراقب باستخدام تقوية الاتساق القائمة على المutex

تتمثل المشكلة الأساسية في التعلم شبه المُراقب (SSL) في كيفية الاستفادة الفعالة من البيانات غير المُعلَّمة، في حين أن معظم الطرق الحالية تركز بشكل كبير على استخدام العينات ذات الثقة العالية، مع تجاهل نسبي لاستغلال العينات ذات الثقة المنخفضة. في هذه الورقة، نهدف إلى استغلال العينات ذات الثقة المنخفضة بطريقة مبتكرة من خلال تنظيم التوافق المُعتمد على المُتَّفَق (Mutex) الذي نقترحه، والذي يُسمَّى MutexMatch. وبشكل محدد، تُطلب من العينات ذات الثقة العالية التنبؤ الدقيق "بما هي عليه" باستخدام فئة التنبؤ الصحيحة (True-Positive Classifier)، بينما تُستخدم العينات ذات الثقة المنخفضة لتحقيق هدف أبسط: التنبؤ بسهولة "بما هي ليست عليه" باستخدام فئة التنبؤ الخاطئة (True-Negative Classifier). وبهذا المعنى، لا نقلل فقط من أخطاء التسمية الافتراضية (pseudo-labeling)، بل نستفيد أيضًا بالكامل من البيانات غير المُعلَّمة ذات الثقة المنخفضة من خلال مبدأ التوافق في درجة التباين. تُظهر MutexMatch أداءً متفوقًا على عدة مجموعات بيانات معيارية، مثل CIFAR-10 وCIFAR-100 وSVHN وSTL-10 وmini-ImageNet وTiny-ImageNet. وأهم من ذلك، تُظهر طريقتنا تفوقًا ملحوظًا عندما تكون كمية البيانات المُعلَّمة قليلة جدًا، حيث تصل إلى دقة 92.23% باستخدام فقط 20 عينة مُعلَّمة على CIFAR-10. تم إتاحة الشفرة البرمجية وأوزان النموذج عبر الرابط التالي: https://github.com/NJUyued/MutexMatch4SSL.