HyperAIHyperAI
منذ 2 أشهر

تعلم كيفية التعلم من البيانات المصنفة بشكل ضوضائي

Junnan Li; Yongkang Wong; Qi Zhao; Mohan Kankanhalli
تعلم كيفية التعلم من البيانات المصنفة بشكل ضوضائي
الملخص

رغم نجاح الشبكات العصبية العميقة (DNNs) في مهام تصنيف الصور، فإن الأداء على مستوى البشر يعتمد على كميات ضخمة من بيانات التدريب ذات التسميات اليدوية عالية الجودة، والتي تكون باهظة الثمن وتحتاج إلى وقت طويل للجمع. هناك العديد من مصادر البيانات الرخيصة على الإنترنت، لكنها تميل إلى احتواء تسميات غير دقيقة. يؤدي التدريب على مجموعات بيانات تحتوي على تسميات مشوهة إلى تدهور الأداء لأن الشبكات العصبية العميقة يمكن أن تتكيّف بسهولة مع الضوضاء في التسميات. لتجاوز هذه المشكلة، نقترح خوارزمية تدريب مقاومة للضوضاء، حيث يتم تنفيذ تحديث تعليمي ميتا (meta-learning) قبل التحديث التقليدي للتدرج (gradient). يحاكي الطريقة المقترحة للتعلم الميتا التدريب الفعلي بإنشاء تسميات مشوهة صناعية (synthetic noisy labels)، ويتم تدريب النموذج بحيث لا يتكيّف مع الضوضاء المحددة بعد كل تحديث بتدرج باستخدام مجموعة من التسميات المشوهة الصناعية. أجرينا سلسلة من التجارب الواسعة على مجموعة بيانات CIFAR-10 المشوهة وعلى مجموعة بيانات Clothing1M. أظهرت النتائج الأداء المتفوق للطريقة المقترحة مقارنة بعدة أسس حديثة رائدة (state-of-the-art baselines).