MentorNet: تعلم منهجية قواعد البيانات للشبكات العصبية العميقة جداً على التسميات المشوهة

الشبكات العميقة الحديثة قادرة على حفظ البيانات الكاملة حتى عندما تكون التسميات عشوائية تمامًا. لتجاوز الانطباع الزائد على التسميات الفاسدة، نقترح تقنية جديدة تتمثل في تعلم شبكة عصبية أخرى تُدعى MentorNet لمراقبة تدريب الشبكات العميقة الأساسية، والتي تُعرف بـ StudentNet. أثناء التدريب، توفر MentorNet منهجًا (خطة وزن العينات) لـ StudentNet للتركيز على العينات التي يحتمل أن تكون تسمياتها صحيحة. على عكس المناهج الحالية التي يتم تعريفها عادةً من قبل الخبراء البشريين، فإن MentorNet تتعلم منهجًا موجهًا بالبيانات بشكل ديناميكي مع StudentNet. تظهر النتائج التجريبية أن نهجنا يمكن أن يحسن بشكل كبير أداء التعميم للشبكات العميقة المدربة على بيانات التدريب الفاسدة. ومن الجدير بالذكر أنه، وفقًا لأفضل علم لنا، حققنا أفضل النتائج المنشورة على WebVision، وهي مجموعة اختبار كبيرة تحتوي على 2.2 مليون صورة ذات تسميات ضوضاء حقيقية. الكود متاح في: https://github.com/google/mentornet