الغالبية يمكن أن تساعد الأقلية: تكرار عينات الأقلية الغنية بالسياق للتصنيف ذي التوزيع الطويل الذيل

يتمثل مشكلة البيانات غير المتوازنة من حيث الفئات في تدهور أداء التعميم لل Classifier نتيجة نقص البيانات من الفئات الأقلية. في هذا البحث، نقترح طريقة جديدة لتعزيز العينات النادرة (minority over-sampling) لتوسيع عينات نادرة متنوعة من خلال استغلال السياق الغني للفئات الغالبة كصور خلفية. ولتحقيق التنويع في العينات النادرة، يكمن الفكرة الأساسية لدينا في وضع صورة من فئة نادرة على صور غنية بالسياق من فئة غالبة، باستخدامها كصور خلفية. تتميز طريقتنا بالبساطة، ويمكن دمجها بسهولة مع الطرق الحالية المعتمدة على التعرف على التوزيع الطويل ذي الذيل (long-tailed recognition methods). وقد أثبتنا تجريبيًا فعالية الطريقة المقترحة من خلال تجارب واسعة ودراسات تحليلية (ablation studies). وبلا أي تغييرات معمارية أو خوارزميات معقدة، تحقق طريقتنا أداءً متقدمًا على أبرز معايير التصنيف ذات التوزيع الطويل ذي الذيل. تم إتاحة الكود الخاص بنا على الرابط التالي: https://github.com/naver-ai/cmo.