التعلم من العلامات الضوضائية المعتمدة على المثال من خلال النمذجة الرسومية

العلامات الضوضائية لا يمكن تجنبها في نظام التعلم العميق، رغم أنها تُعد مشكلة مزعجة، لأن النماذج يمكن أن تتعرض بسهولة للاختلال التعلمي (overfitting) تجاهها. توجد أنواع متعددة من الضوضاء في العلامات، مثل ضوضاء متماثلة، وضوضاء غير متماثلة، وضوضاء تعتمد على المثال (IDN)، حيث تمثل ضوضاء IDN النوع الوحيد الذي يعتمد على معلومات الصورة. ويُعد هذا الاعتماد على معلومات الصورة عاملًا حاسمًا في دراسة ضوضاء IDN، بالنظر إلى أن الأخطاء في التصنيف تنشأ في جزء كبير منها بسبب نقص أو غموض في المعلومات المتعلقة بالفئات البصرية المُحتَوَاة في الصور. ولتقديم تقنية فعّالة لمعالجة ضوضاء IDN، نقدّم نموذجًا رسمياً جديداً يُسمى InstanceGM، الذي يدمج بين النماذج التمييزية (discriminative) والنمذجة التوليدية (generative). وتشمل المساهمات الرئيسية لـ InstanceGM ما يلي: (أ) استخدام توزيع برنولي مستمر (continuous Bernoulli) لتدريب النموذج التوليدية، مما يوفر مزايا كبيرة في التدريب، و(ب) استكشاف فئة متقدمة من فئات التصنيف المُتّسِمة بالضوضاء (noisy-label discriminative classifier) لاستخلاص علامات نظيفة من عينات مُصنّفة بضوضاء تعتمد على المثال. ويُظهر InstanceGM أداءً تنافسيًا مع الأساليب الحالية لتعلم النماذج ذات العلامات الضوضائية، وبخاصة في اختبارات ضوضاء IDN باستخدام مجموعات بيانات مُصَنَّعة وواقعية، حيث تتفوّق طريقة العمل لدينا على المنافسين في معظم التجارب من حيث الدقة.