التصدي للعلامات الضوضائية من خلال الاتفاق: طريقة تدريب مشتركة مع ت régularisation المزدوجة

التعلم العميق باستخدام علامات مُشوَّشة يُعد مشكلة عملية صعبة في التعلم المُراقب الضعيف. تدعي الطرق المتطورة حاليًا مثل "فك الارتباط" (Decoupling) و"التدرّب المشترك+" (Co-teaching+) أن استراتيجية "الانعدام في الاتفاق" (disagreement) تُعد حاسمة لتخفيف مشكلة التعلُّم باستخدام علامات مُشوَّشة. في هذه الورقة، نبدأ من منظور مختلف ونُقدِّم نموذجًا تعلُّميًا قويًا يُسمى JoCoR، يهدف إلى تقليل التباين بين شبكتين خلال التدريب. وبشكل مفصّل، نستخدم في البداية شبكتين لتوليد تنبؤات على نفس مجموعة البيانات الصغيرة (mini-batch)، ثم نحسب خسارة مشتركة باستخدام التوصيف التعاوني (Co-Regularization) لكل مثال تدريبي. بعد ذلك، نختار الأمثلة ذات الخسارة الأصغر لتحديث معاملات الشبكتين معًا في آنٍ واحد. وباستخدام الخسارة المشتركة، تصبح الشبكتان أكثر تشابهًا تدريجيًا بفعل تأثير التوصيف التعاوني. وقد أظهرت النتائج التجريبية الواسعة على بيانات مُتضررة من مجموعات بيانات معيارية، بما في ذلك MNIST وCIFAR-10 وCIFAR-100 وClothing1M، أن JoCoR يتفوّق على العديد من الطرق المتطورة حاليًا في التعلُّم باستخدام علامات مُشوَّشة.