Command Palette
Search for a command to run...
L_DMI: دالة خسارة مبتكرة تعتمد على نظرية المعلومات لتدريب الشبكات العميقة المقاومة لضوضاء التسمية
L_DMI: دالة خسارة مبتكرة تعتمد على نظرية المعلومات لتدريب الشبكات العميقة المقاومة لضوضاء التسمية
Yilun Xu Yuqing Kong Peng Cao Yizhou Wang
الملخص
يُعدّ تسمية مجموعات البيانات الكبيرة بدقة مشكلة مكلفة للغاية من حيث الوقت والمال. وعلى الرغم من أن الحصول على مجموعات بيانات مُسَمّاة بجودة منخفضة يمكن أن يكون أرخص بكثير، إلا أن استخدامها دون معالجة خاصة يؤدي غالبًا إلى تدهور كبير في أداء النماذج المدربة. تم اقتراح العديد من الطرق لتعلم النماذج باستخدام تسميات ضوضائية، لكن معظم هذه الطرق تتعامل فقط مع أنماط ضوضاء محدودة، أو تتطلب معلومات إضافية أو خطوات إضافية (مثل معرفة أو تقدير مصفوفة انتقال الضوضاء)، أو تفتقر إلى تبرير نظري. في هذا البحث، نقترح دالة خسارة جديدة قائمة على النظرية المعلوماتية، تُسمّى L_DMI، لتدريب الشبكات العصبية العميقة بحيث تكون مقاومة لضوضاء التسميات. وتمثّل النواة الأساسية لـ L_DMI نسخة معممة من المعلومات المتبادلة، تُعرف باسم "المعلومات المتبادلة المستندة إلى المحدد" (DMI)، والتي لا تُظهر فقط خاصية التزايد المعلوماتي (information-monotone)، بل تتميز أيضًا بثبات نسبي. إلى أقصى حدّ معروف لدينا، تمثل L_DMI أول دالة خسارة تُثبت نظريًا مقاومتها لضوضاء التسميات المستقلة عن المثال، بغض النظر عن نمط الضوضاء، ويمكن تطبيقها مباشرة على أي شبكة عصبية تصنيفية موجودة دون الحاجة إلى أي معلومات إضافية. وبالإضافة إلى التبرير النظري، نُظهر تجريبيًا أن استخدام L_DMI يتفوق على جميع البدائل الأخرى في مهام التصنيف على كلا من مجموعات بيانات الصور والنصوص، بما في ذلك Fashion-MNIST، CIFAR-10، Dogs vs. Cats، MR، مع مجموعة متنوعة من أنماط الضوضاء المُولَّدة ومستويات الضوضاء المختلفة، بالإضافة إلى مجموعة بيانات واقعية تُسمّى Clothing1M.