HyperAIHyperAI
منذ 17 أيام

LongReMix: تعلّم مقاوم مع عينات ذات ثقة عالية في بيئة تسمية مشوّشة

Filipe R. Cordeiro, Ragav Sachdeva, Vasileios Belagiannis, Ian Reid, Gustavo Carneiro
LongReMix: تعلّم مقاوم مع عينات ذات ثقة عالية في بيئة تسمية مشوّشة
الملخص

تمثّل نماذج الشبكات العصبية العميقة مقاومةً جيدةً لمستويات محدودة من الضوضاء في التصنيفات، ولكن قدرتها على تذكّر التصنيفات الخاطئة في المشكلات التي تتميز بنسب عالية من الضوضاء لا تزال مسألة مفتوحة. تعتمد أكثر الخوارزميات فعالية في معالجة التصنيفات الضوضائية على عملية مزدوجة تتكوّن من مرحلتين: الأولى تُعدّ تعلّمًا غير مُراقب لتصنيف عينات التدريب إلى "نظيفة" أو "مُشوّشة"، تليها مرحلة تعلّم شبه مُراقب يُقلّل من المخاطر التجريبية الحقيقية (EVR) باستخدام مجموعة مُصنّفة من العينات النظيفة، ومجموعة غير مصنّفة من العينات المشوّشة. في هذه الورقة، نُقدّم فرضية مفادها أن أداء التعميم لهذه الخوارزميات ذات المرحلتين يعتمد على دقة تصنيف المُصنّف غير المُراقب وحجم مجموعة التدريب، بهدف تقليل المخاطر التجريبية الحقيقية. وقد قمنا بتأكيد هاتين الفرضيتين تجريبيًا، واقترحنا خوارزمية جديدة لتدريب ذات مرحلتين تُسمّى LongReMix. تم اختبار LongReMix على مجموعات معايير الضوضاء في التصنيف، بما في ذلك CIFAR-10، CIFAR-100، WebVision، Clothing1M، وFood101-N. وأظهرت النتائج أن LongReMix تتفوّق في التعميم مقارنةً بالأساليب المنافسة، وبخاصة في المشكلات ذات نسب عالية من الضوضاء. علاوةً على ذلك، حققت طريقة عملنا أداءً يُعدّ من أفضل الأداء في معظم المجموعات. يمكن الاطلاع على الشفرة المصدرية على الرابط التالي: https://github.com/filipe-research/LongReMix.