تحسين المعايرة للتمييز الطويل الذيل

قد تؤدي الشبكات العصبية العميقة إلى أداء ضعيف عندما تكون مجموعات التدريب متمايزَة بشكل كبير من حيث الفئات. في الآونة الأخيرة، اعتمدت طرق ثنائية المراحل على فصل تعلم التمثيل عن تعلم المصنف لتحسين الأداء. ولكن ما يزال هناك قضية جوهرية تتمثل في عدم التوازن في التقدير (miscalibration). ولحل هذه المشكلة، قمنا بتصميم طريقتين لتحسين التوازن والأداء في مثل هذه السياقات. مستفيدين من حقيقة أن توزيعات الاحتمالات المتنبأ بها للطبقات مرتبطة ارتباطًا وثيقًا بعدد مثيلات كل طبقة، اقترحنا تمهيدًا مُراعِيًا للصفة (label-aware smoothing) لمعالجة درجات التفوق المفرط في التقدير المختلفة بين الطبقات وتحسين تعلم المصنف. وبالنسبة للتحيز الناتج عن الفروق بين مجموعتي البيانات في هاتين المراحل بسبب استخدام عينات مختلفة، قمنا أيضًا باقتراح تطبيع الدُفعة المنقولة (shifted batch normalization) ضمن الإطار المُفصَّل. وقد حققت الطرق المقترحة أرقامًا قياسية جديدة على عدة مجموعات معيارية شهيرة للتمييز الطويلة الذيل (long-tailed recognition)، بما في ذلك CIFAR-10-LT وCIFAR-100-LT وImageNet-LT وPlaces-LT وiNaturalist 2018. وستكون الشفرة المصدرية متاحة عبر الرابط: https://github.com/Jia-Research-Lab/MiSLAS.