SAFA: تعزيز الميزات القابلة للتكيف مع العينة لتصنيف الصور ذات التوزيع الطويل الذيل
تُعدّ البيانات غير المتوازنة ذات التوزيع الطويل الذيل (long-tailed distribution) شائعة في التطبيقات العملية، وتُشكّل تحديًا كبيرًا للشبكات العميقة في التعامل مع التحيّز في التنبؤات بين الفئات الرئيسية (الكثيرة، الشائعة) والفئات الطرفية (القليلة، النادرة). غالبًا ما تكون مساحة الميزات الخاصة بالفئات الطرفية غير ممثلة بشكل كافٍ في الشبكات العميقة، مما يؤدي إلى أداء غير متجانس بين الفئات المختلفة. تعتمد الطرق الحالية على تكبير ميزات الفئات الطرفية لتعويض النقص في مساحة الميزات، لكن هذه الطرق تفشل في الأداء العام عند التقييم (المرحلة التحققية). وللتقليل من هذه المشكلة، نقترح طريقة جديدة تُسمى "تكبير الميزات المتكيفة مع العينة" (Sample-Adaptive Feature Augmentation - SAFA)، والتي تُكمل ميزات الفئات الطرفية بهدف تحسين أداء المصنف. تهدف SAFA إلى استخلاص اتجاهات معنوية متنوعة قابلة للنقل من الفئات الرئيسية، ثم تُطبّق ترجمة متكيفة لميزات الفئات الطرفية على طول هذه الاتجاهات المعنية لغرض التكبير. تعتمد SAFA على نموذج تدريب إعادة استخدام (recycling training scheme) لضمان أن تكون الميزات المُكَبَّرة مخصصة لكل عينة على حدة. كما تُستخدم دالة التباين (contrastive loss) لضمان أن تكون الاتجاهات المعنوية القابلة للنقل غير مرتبطة بالفئة، بينما تُطبّق دالة التماسك النمطي (mode-seeking loss) لتكوين ميزات متنوعة للفئات الطرفية وتوسيع مساحة ميزات هذه الفئات. تميز SAFA بكونها طريقة قابلة للتكامل (plug-in) سهلة الاستخدام ومتعددة الاستخدامات، ويمكن دمجها مع مختلف الطرق أثناء مرحلة التدريب دون إضافة أي عبء حسابي عند التقييم. وباستخدام SAFA، نحقق نتائج متميزة على مجموعات بيانات CIFAR-LT-10 وCIFAR-LT-100 وPlaces-LT وImageNet-LT وiNaturalist2018.