إعادة التفكير في أساليب التوازن الطبقي للتعرف البصري طويل الذ đu بمنظور التكييف النطاقي

تتبع تكرار الكيانات في العالم الحقيقي غالبًا قانون القوة (power law)، مما يؤدي إلى عدم توافق بين مجموعات البيانات التي تُظهر توزيعات فئات ذات ذيل طويل (long-tailed) التي يراها نموذج تعلم الآلة، وبين توقعاتنا بتحقيق الأداء الجيد على جميع الفئات. نحلل هذا الفجوة من منظور التكييف بين المجالات (domain adaptation). أولاً، نربط بين الطرق الحالية المُستخدمة لموازنة الفئات في تصنيف البيانات ذات الذيل الطويل وبين مفهوم "انزياح الهدف" (target shift)، وهي حالة جُرّبَت جيدًا في مجال التكييف بين المجالات. تُظهر هذه الصلة أن هذه الطرق تفترض ضمنيًا أن توزيعات الفئات المشروطة (class-conditioned distribution) في بيانات التدريب وبيانات الاختبار هي نفسها، وهو افتراض لا ينطبق عمومًا، وخاصةً بالنسبة للفئات الضعيفة (التي تقع في الذيل). بينما قد تحتوي الفئات المهيمنة (الرأسية) على أمثلة تدريب كثيرة ومتنوعة تمثل جيدًا البيانات المتوقعة أثناء الاستدلال، فإن الفئات الضعيفة غالبًا ما تعاني من نقص في بيانات التدريب الممثلة. ولحل هذه المشكلة، نقترح تعزيز منهجية التعلم المُوازن للصفات الكلاسيكية من خلال تقدير صريح للفرق بين توزيعات الفئات المشروطة باستخدام نهج التعلم التماثلي (meta-learning). ونُحقّق فعالية نهجنا من خلال تجربته على ستة مجموعات بيانات معيارية وثلاثة دوال خسارة.