HyperAIHyperAI
منذ 17 أيام

PropMix: التصفية حسب العينات الصعبة وتمييز المزيج النسبي للتعلم مع التسميات الضوضائية

Filipe R. Cordeiro, Vasileios Belagiannis, Ian Reid, Gustavo Carneiro
PropMix: التصفية حسب العينات الصعبة وتمييز المزيج النسبي للتعلم مع التسميات الضوضائية
الملخص

تُعتمد أكثر الطرق تنافسية لتعلم العينات ذات التسميات الضوضائية على تصنيف غير مراقب للعينات النظيفة والعينات الضوضائية، حيث يتم إعادة تسمية العينات التي تم تصنيفها على أنها ضوضائية، ثم "مُزجَّة" مع العينات النظيفة باستخدام تقنية MixMatch. تواجه هذه الطرق مشكلتين رئيسيتين في المشكلات ذات معدلات ضوضاء عالية: 1) من المرجح أن يحتوي المجموعة الضوضائية على عينات صعبة يتم إعادة تسميتها بشكل خاطئ، و2) ينخفض عدد العينات الناتجة من خوارزمية MixMatch بسبب القيود الناتجة عن حجم المجموعة النظيفة الصغيرة. في هذه الورقة، نقدّم خوارزمية التعلم PropMix لمعالجة المشكلتين أعلاه. تُزيل PropMix العينات الضوضائية الصعبة، بهدف زيادة احتمالية إعادة التسمية الصحيحة للعينات الضوضائية السهلة. علاوةً على ذلك، تُدمج PropMix العينات النظيفة مع العينات الضوضائية التي أُعدت تسميتها وتم التسمية الصحيحة لها في مجموعة تدريب يتم تعزيزها باستخدام تقنية MixUp، مما يُزيل قيد حجم المجموعة النظيفة الصغيرة، ويُضمن تضمين نسبة كبيرة من العينات الضوضائية السهلة التي تم إعادة تسميتها بشكل صحيح. كما نُضمن عملية ما قبل التدريب ذاتية التوجيه (self-supervised) لتحسين المقاومة في السيناريوهات ذات التسميات الضوضائية العالية. تُظهر تجاربنا أن PropMix تحقق نتائج من الطراز الرائد (SOTA) على مجموعات بيانات CIFAR-10 وCIFAR-100 (باستخدام أنواع مختلفة من ضوضاء التسمية: متماثلة، غير متماثلة، وضوضاء ذات معنى)، وRed Mini-ImageNet (من مجموعات التسميات الضوضائية المُحكَمة على الويب)، وClothing1M وWebVision. وفي معايير التقييم الشديدة الضوضاء، تتفوّق نتائجنا بشكل ملحوظ على الطرق الأخرى. يمكن الوصول إلى الكود من خلال الرابط: https://github.com/filipe-research/PropMix.

PropMix: التصفية حسب العينات الصعبة وتمييز المزيج النسبي للتعلم مع التسميات الضوضائية | أحدث الأوراق البحثية | HyperAI