HyperAIHyperAI
منذ 17 أيام

تصحيح محدود بالخطأ للوسوم المضطربة

Songzhu Zheng, Pengxiang Wu, Aman Goswami, Mayank Goswami, Dimitris Metaxas, Chao Chen
الملخص

لجمع بيانات مُعلَّمة على نطاق واسع، يصبح من المستحيل تجنب إدخال ضوضاء التسمية، أي التسميات الفئوية الخاطئة. ولضمان القدرة على التحمل تجاه ضوضاء التسمية، تعتمد العديد من الطرق الناجحة على فئة التصنيف الضوضائية (أي النماذج التي تم تدريبها على بيانات تدريب تحتوي على ضوضاء) لتحديد ما إذا كانت التسمية موثوقة أم لا. ومع ذلك، لا يزال غير معروف سبب فعالية هذا المنهج التجريبي في التطبيق العملي. في هذا البحث، نقدم التفسير النظري الأول لهذه الطرق. ونُثبت أن تنبؤات فئة التصنيف الضوضائية يمكن أن تكون مؤشراً جيداً على ما إذا كانت تسمية البيانات التدريبية نظيفة أم لا. استناداً إلى النتيجة النظرية، نقترح خوارزمية جديدة تقوم بتصحيح التسميات بناءً على تنبؤات فئة التصنيف الضوضائية. وتشير التسميات المُصحَّحة إلى التصنيف البيزي المثالي الحقيقي بدرجة عالية من الاحتمال. ونُدمج خوارزمية تصحيح التسميات هذه في عملية تدريب الشبكات العصبية العميقة، ونُدرّب نماذج تحقق أداءً متفوّقاً في الاختبار على عدة مجموعات بيانات عامة.