M2m: التصنيف غير المتوازن من خلال الترجمة من الأغلبية إلى الأقلية

في معظم السيناريوهات الواقعية، تكون مجموعات البيانات التدريبية ذات التسميات متوازنة بشكل كبير من حيث الفئات، حيث يعاني الشبكات العصبية العميقة من صعوبة التعميم وفق معيار اختبار متوازن. في هذه الورقة، نستعرض طريقة جديدة ولكن بسيطة للتخفيف من هذه المشكلة من خلال تعزيز الفئات الأقل تكرارًا من خلال تحويل العينات (مثل الصور) من الفئات الأكثر تكرارًا. تُمكّن هذه الطريقة البسيطة المصنف من تعلم ميزات أكثر قابلية للتعميم للفئات الأقلية، من خلال نقل واستغلال تنوع المعلومات المتعلقة بالفئات الغالبة. تُظهر النتائج التجريبية على مجموعة متنوعة من مجموعات البيانات ذات التوزيع غير المتوازن أن الطريقة المقترحة تحسن التعميم على الفئات الأقلية بشكل ملحوظ مقارنةً بأساليب إعادة العينة أو إعادة الوزن الأخرى المتوفرة. كما تفوق أداء طريقة لدينا أداء الطرق السابقة المُصنفة كأفضل النماذج الحالية في تصنيف البيانات غير المتوازنة.