MixMatch: نهج شامل للتعلم شبه المشرف عليه

أثبت التعلم شبه المشرف أنه نموذج قوي للاستفادة من البيانات غير المصنفة لتقليل الاعتماد على مجموعات بيانات كبيرة ومصنفة. في هذا العمل، نقوم بتوحيد النهج السائدة حاليًا في مجال التعلم شبه المشرف لإنتاج خوارزمية جديدة تُسمى MixMatch، تعمل هذه الخوارزمية من خلال تخمين تسميات ذات انتروبيا منخفضة للنماذج المعززة بالبيانات غير المصنفة وخلط البيانات المصنفة وغير المصنفة باستخدام تقنية MixUp. نوضح أن MixMatch تحصل على أفضل النتائج الحالية بفارق كبير عبر العديد من مجموعات البيانات وأحجام البيانات المصنفة. على سبيل المثال، في مجموعة بيانات CIFAR-10 مع 250 تسمية، نحن نقلل معدل الخطأ بمقدار أربع مرات (من 38٪ إلى 11٪) وفي STL-10 بمقدار ضعفين. كما نظهر كيف يمكن لمixMatch أن يساعد في تحقيق توازن أفضل بكثير بين الدقة والخصوصية للخصوصية التفاضلية (Differential Privacy). أخيرًا، نجري دراسة فك الارتباط (Ablation Study) لتحديد أي مكونات MixMatch هي الأكثر أهمية لنجاحها.