FixMatch: تبسيط التعلم شبه المراقب باستخدام الاتساق والثقة

يُعد التعلم شبه المُراقب (SSL) وسيلة فعّالة لاستغلال البيانات غير المُعلّمة لتحسين أداء النموذج. في هذه الورقة، نُظهر القوة الناتجة عن الجمع البسيط بين طريقتين شائعتين في التعلم شبه المُراقب: الت régularisation التماسكية (consistency regularization) والتدلّي الوهمي (pseudo-labeling). يعتمد خوارزميتنا، FixMatch، على إنشاء تدليات وهمية باستخدام تنبؤات النموذج بالنسبة للصور غير المُعلّمة التي خضعت لتحسين ضعيف. ويُحتفظ بالتسمية الوهمية فقط إذا أنتج النموذج تنبؤًا عالي الثقة. ثم يُدرّب النموذج على التنبؤ بالتسمية الوهمية عند إدخال نسخة مُعززة بشكل قوي من الصورة نفسها. وعلى الرغم من بساطة هذه الطريقة، نُظهر أن FixMatch تحقق أداءً متفوّقًا على مستوى الحد الأقصى (state-of-the-art) في مجموعة متنوعة من معايير التعلم شبه المُراقب القياسية، بما في ذلك دقة 94.93% على CIFAR-10 باستخدام 250 علامة فقط، ودقة 88.61% باستخدام 40 علامة فقط — أي 4 علامات فقط لكل فئة. وبما أن FixMatch تشبه إلى حد كبير الطرق الحالية في التعلم شبه المُراقب التي تحقق أداءً أقل، قمنا بدراسة تحليلية موسعة (ablation study) لتحديد العوامل التجريبية الأكثر أهمية في نجاح FixMatch. ونُشر الكود الخاص بنا على الرابط التالي: https://github.com/google-research/fixmatch.