HyperAIHyperAI
منذ 17 أيام

CMW-Net: تعلّم خريطة ترجيح العينات المعتمدة على الفئة لتعلم عميق مرن

Jun Shu, Xiang Yuan, Deyu Meng, Zongben Xu
CMW-Net: تعلّم خريطة ترجيح العينات المعتمدة على الفئة لتعلم عميق مرن
الملخص

يمكن للشبكات العصبية العميقة الحديثة أن تتعرض بسهولة للاختزال الزائد (overfitting) تجاه بيانات التدريب المتحيزة التي تحتوي على علامات مُتضررة أو عدم توازن بين الفئات. تُستخدم طرق إعادة ترجيح العينات بشكل شائع لتخفيف هذه المشكلة الناتجة عن التحيز في البيانات. ومع ذلك، تتطلب معظم الطرق الحالية تحديدًا يدويًا لخطط إعادة الترجيح، فضلًا عن المعلمات الإضافية (hyper-parameters) التي تعتمد على خصائص المشكلة المدروسة وبيانات التدريب. وهذا يجعلها معقدة نسبيًا وصعبة التعميم في السياقات العملية، نظرًا لتعقيداتها العالية وتباين التحيزات بين الفئات المختلفة. لمعالجة هذه المشكلة، نقترح نموذجًا متعددًا (meta-model) قادرًا على تعلُّم خطة إعادة ترجيح صريحة بشكل تكيفي مباشرة من البيانات. وبصورة محددة، وباعتبار كل فئة تدريب كمهمة تعلم منفصلة، يهدف نهجنا إلى استخلاص دالة إعادة ترجيح صريحة تتلقى كمدخلات خسارة العينة وخصائص المهمة/الفئة، وتُخرِج وزن العينة، بهدف تطبيق خطط إعادة ترجيح متغيرة تكيفيًا على فئات العينات المختلفة بناءً على خصائص التحيز المتأصلة فيها. وقد أثبتت التجارب على بيانات مُصَنَّعة وبيانات حقيقية قدرة النهج المُقترح على تحقيق خطط إعادة ترجيح مناسبة في مختلف حالات التحيز، مثل حالات عدم التوازن بين الفئات، وضوضاء العلامات المستقلة عن الميزات، وضوضاء العلامات المعتمدة على الميزات، بالإضافة إلى سيناريوهات تحيز أكثر تعقيدًا من الحالات التقليدية. علاوةً على ذلك، تم التحقق من قابلية نقل المهمة (task-transferability) للخطة المُعادَة ترجيحها، من خلال تطبيق الدالة المُعادَة ترجيحها المُتعلّمة على مجموعة بيانات CIFAR-10 ذات الحجم الأصغر على مجموعة WebVision الكاملة ذات الحجم الأكبر، حيث تم تحقيق تحسن في الأداء مقارنةً بالطرق السابقة ذات الأداء الأفضل (SOAT) دون الحاجة إلى ضبط معلمات إضافية أو خطوات تدرج متعددة (meta gradient descent). كما تم التحقق من الجاهزية العامة لنهجنا في معالجة عدة مشكلات في التعلم العميق المقاوم، بما في ذلك التعلم بعلامات جزئية (partial-label learning)، والتعلم شبه المراقب (semi-supervised learning)، والتصنيف المُختار (selective classification).