HyperAIHyperAI
منذ 8 أيام

بروميكس: مكافحة ضوضاء التسمية من خلال تحسين فائدة العينات النظيفة

Ruixuan Xiao, Yiwen Dong, Haobo Wang, Lei Feng, Runze Wu, Gang Chen, Junbo Zhao
بروميكس: مكافحة ضوضاء التسمية من خلال تحسين فائدة العينات النظيفة
الملخص

أصبح التعلّم مع العلامات الضوضائية (LNL) موضوعًا جذابًا، نظرًا لأن البيانات التي تم تسميتها بشكل غير مثالي تكون أرخص نسبيًا في الحصول عليها. تعتمد الأساليب الحديثة المتطورة على آليات اختيار محددة لفصل العينات النظيفة عن العينات الضوضائية، ثم تطبّق تقنيات التعلّم شبه المُعلَّم (SSL) لتحسين الأداء. ومع ذلك، فإن خطوة الاختيار غالبًا ما تُنتج مجموعة نظيفة متوسطة الحجم وذات جودة مقبولة، مما يتجاهل مجموعة غنية من العينات النظيفة. وللإكمال هذه الفجوة، نقترح إطارًا جديدًا لـ LNL يُدعى ProMix، والذي يسعى إلى تحسين الاستفادة القصوى من العينات النظيفة لتعزيز الأداء. ويعتمد جوهر طريقة لدينا على تقنية اختيار عالية الثقة مطابقة، تُختار من خلالها العينات ذات درجات الثقة العالية والتي تتطابق توقعاتها مع العلامات المُعطاة، بهدف توسيع مجموعة العينات النظيفة الأساسية بشكل ديناميكي. وللتغلب على الآثار الجانبية المحتملة لعملية اختيار مجموعة نظيفة مفرطة، نصمم أيضًا إطارًا جديدًا لـ SSL قادر على تدريب تصنيفات متوازنة وغير متحيزة على العينات المنفصلة النظيفة والضوضائية. تُظهر التجارب الواسعة أن ProMix يُحدث تقدمًا كبيرًا في نتائج الحالة الحالية على عدة معايير مختلفة من حيث أنواع ومستويات الضوضاء. ويحقق متوسط تحسين بنسبة 2.48٪ على مجموعة بيانات CIFAR-N. يُمكن الاطلاع على الكود على الرابط: https://github.com/Justherozen/ProMix

بروميكس: مكافحة ضوضاء التسمية من خلال تحسين فائدة العينات النظيفة | أحدث الأوراق البحثية | HyperAI