منذ 2 أشهر
التعلم المحكوم بالبعد مع التسميات الضوضائية
Xingjun Ma; Yisen Wang; Michael E. Houle; Shuo Zhou; Sarah M. Erfani; Shu-Tao Xia; Sudanthi Wijewickrema; James Bailey

الملخص
البيانات التي تحتوي على نسب كبيرة من التسميات الصاخبة (غير الصحيحة) تشكل تحديات لتدريب شبكات العصبونات العميقة (DNNs) بدقة. نقترح وجهة نظر جديدة لفهم تعميم شبكات العصبونات العميقة لهذه البيانات، من خلال دراسة بُعد مساحة التمثيل العميق للعينات التدريبية. نوضح أن من منظور البُعد، تظهر شبكات العصبونات العميقة أساليب تعلم متميزة عند تدريبها باستخدام التسميات النظيفة مقارنةً بتدريبها باستخدام نسبة من التسميات الصاخبة. بناءً على هذا الاكتشاف، طوّرنا استراتيجية تعلم جديدة تعتمد على البُعد، والتي تقوم بمراقبة بُعد المساحات الفرعية أثناء التدريب وتعديل دالة الخسارة وفقًا لذلك. لقد أثبتنا بالتجربة أن طريقتنا مقاومة للغاية لنسب كبيرة من التسميات الصاخبة، ويمكنها تعلم المساحات الفرعية المحلية ذات الأبعاد المنخفضة التي تعكس توزيع البيانات.