التعرف على التوزيع الطويل باستخدام خبراء متوازنين حسب الفئة

يُمكّن التعلّم العميق من أداء مبهر في التعرف على الصور باستخدام مجموعات بيانات ضخمة متوازنة اصطناعيًا. ومع ذلك، تُظهر مجموعات البيانات الواقعية توزيعات غير متوازنة بشكل كبير بين الفئات، مما يُولّد تحديين رئيسيين: عدم التوازن النسبي بين الفئات، وندرة البيانات بالنسبة للفئات المتوسطة أو القليلة (mediumshot أو fewshot). في هذه الدراسة، نعالج مشكلة التعرف الطويلة الذيل (long-tailed recognition)، حيث تكون مجموعة التدريب غير متوازنة بشدة، بينما تُحتفظ بمجموعة الاختبار بالتوازن. على عكس النماذج الحالية التي تعتمد على إعادة أخذ العينات من البيانات، أو التعلم الحساس للتكلفة، أو استخراج الأمثلة الصعبة في الوقت الفعلي، أو إعادة تشكيل دالة الخسارة، أو النمذجة القائمة على الذاكرة، نقترح تجميعًا من خبراء متوازنين حسب الفئات، يجمع بين قوة تصنيفات متنوعة. يحقق هذا التجميع من الخبراء المتوازنين حسب الفئات نتائج قريبة من أفضل النتائج المُحققة حاليًا، ويُسجّل التجميع المُوسّع نتائج جديدة تُعدّ أفضل من كل ما سبق على حدين من معايير التعرف الطويلة الذيل. قمنا بإجراء تجارب واسعة لتحليل أداء التجميعات، ووجدنا أن عدم التوازن النسبي يُعدّ مشكلة أصعب من ندرة البيانات في مجموعات البيانات الكبيرة الحديثة. تتوفر رموز التدريب والاختبار على الرابط: https://github.com/ssfootball04/class-balanced-experts.