RealMix: نحو خوارزميات تعلم عميق شبه مراقبة واقعية

أظهرت خوارزميات التعلم شبه المُعلَّم (SSL) إمكانات كبيرة في سياقات التدريب عندما يكون الوصول إلى البيانات المُعلَّمة محدودًا ولكن الوصول إلى البيانات غير المُعلَّمة وفيرًا. ومع ذلك، تُظهر تجاربنا عدة نقاط ضعف تُعاني منها الخوارزميات السابقة لـ SSL. وبشكل خاص، الأداء الضعيف عندما تختلف توزيعات البيانات المُعلَّمة وغير المُعلَّمة. ولحل هذه الملاحظات، طوّرنا RealMix، التي تحقق نتائج من الطراز الرائد على مجموعات بيانات معيارية قياسية في مختلف أحجام مجموعات البيانات المُعلَّمة وغير المُعلَّمة، مع التغلب على التحديات المذكورة أعلاه. وتجدر الإشارة إلى أن RealMix حققت معدل خطأ قدره 9.79% على مجموعة CIFAR10 باستخدام 250 علامة فقط، وهي الطريقة الوحيدة من بين جميع خوارزميات SSL المختبرة التي تمكنت من تجاوز أداء النموذج الأساسي عند وجود تباين كبير في توزيعات البيانات المُعلَّمة وغير المُعلَّمة. تُظهر RealMix كيف يمكن استخدام التعلم شبه المُعلَّم في الظروف الواقعية التي تكون فيها موارد البيانات والحساب محدودة، وتُوجِّه الأبحاث المستقبلية في مجال التعلم شبه المُعلَّم باتجاه تطبيقات عملية مُحَسَّنة.