SSR: إطار فعّال ومقاوم لتعلم مع ضجيج غير معروف في التصنيفات

رغم التقدم الكبير في التعلم المراقب باستخدام الشبكات العصبية، تظل هناك تحديات كبيرة في الحصول على مجموعات بيانات كبيرة وعالية الجودة ومضبوطة التسمية بدقة. وفي هذا السياق، أصبحت مشكلة التعلم في ظل وجود تسميات ملوثة (مُتَعَلِّمَة بضجيج) موضوعًا يجذب اهتمامًا متزايدًا. وباعتبارها مشكلة نسبيًا معقدة، فإن الطرق الحالية التي تسعى لتحقيق نتائج جيدة غالبًا ما تدمج عناصر من مجالات متعددة، مثل التعلم المراقب، والتعلم شبه المراقب، والتعلم الناقل (transfer learning)، ما يؤدي إلى طرق معقدة. علاوةً على ذلك، فإن هذه الطرق تفرض غالبًا افتراضات متعددة حول نوع الضجيج في البيانات، مما يُضعف مقاومة النموذج ويحد من أداؤه في ظروف ضجيج مختلفة. في هذه الورقة، نتناول إعدادًا مشكلة جديدًا يُعرف بـ "التعلم مع ضجيج تسميات غير معروف" (Learning with Unknown Label Noise - LULN)، أي التعلم عندما تكون كل من درجة ونوع الضجيج غير معروفين. في ظل هذا الإعداد، وعلى عكس الطرق السابقة التي تُدخل افتراضات متعددة وتؤدي إلى حلول معقدة، نقترح إطارًا بسيطًا وفعالًا ومقاومًا يُسمى "اختيار العينات وإعادة التسمية" (Sample Selection and Relabelling - SSR)، والذي يحقق نتائج من الطراز الأول (SOTA) في ظروف متنوعة بحد أدنى من المعلمات القابلة للضبط (hyperparameters). وتركز طريقةنا على آلية اختيار العينات وإعادة تسميتها، تقوم على فئة تصنيف غير تباعدية (KNN غير تباعدي) $g_q$ وفئة تصنيف معتمدة على معلمات (نموذج تصنيف معتمد على معلمات) $g_p$، لاختيار العينات النظيفة وتحديث تسميات العينات الملوثة تدريجيًا. وبلا تعقيدات إضافية، مثل التدريب التعاوني للنماذج أو التدريب المسبق ذاتيًا أو التعلم شبه المراقب، وبفضل مقاومتها تجاه تعيين المعلمات القليلة التي يعتمد عليها، تتفوق طريقةنا بشكل كبير على الطرق السابقة على مجموعات بيانات مصطنعة مثل CIFAR10/CIFAR100، وكذلك على مجموعات بيانات واقعية ملوثة مثل WebVision وClothing1M وANIMAL-10N. يمكن الاطلاع على الكود عبر الرابط: https://github.com/MrChenFeng/SSR_BMVC2022.