إعادة النظر في التصنيف الطويل الذيل للصور: مراجعة ومقاييس معيارية مع مقاييس تقييم جديدة

في الآونة الأخيرة، حظيت تصنيف الصور ذات التوزيع الطويل الذيل (long-tailed image classification) باهتمام كبير من قبل الباحثين، نظرًا لأن توزيع البيانات يكون طويل الذيل في العديد من السياقات الواقعية. تم اقتراح عدد كبير من الخوارزميات لمعالجة مشكلة عدم توازن البيانات من خلال إحداث انحياز في عملية التدريب نحو الفئات الأقل تكرارًا. ومع ذلك، غالبًا ما تُقيَّم أداء هذه الخوارزميات على مجموعات اختبار متوازنة أو على مجموعات اختبار مستقلة متعددة تختلف توزيعاتها عن توزيع بيانات التدريب. وبما أن بيانات الاختبار قد تمتلك توزيعات عشوائية، فإن الاستراتيجيات الحالية لتقييم الأداء غير قادرة على عكس الأداء التصنيفي الفعلي بشكل موضوعي. ولذلك، قمنا بإنشاء معايير تقييم جديدة تعتمد على سلسلة من مجموعات الاختبار ذات التوزيعات المتغيرة. كما تم تصميم مجموعة من المؤشرات (corpus of metrics) لقياس دقة الخوارزميات، وثباتها، وحدودها عند التعلم من توزيعات ذات ذيول طويلة. وباستخدام هذه المعايير، قمنا بإعادة تقييم أداء الطرق الحالية على مجموعتي بيانات CIFAR10 وCIFAR100، وهو ما يُعد مفيدًا لتوجيه اختيار تقنيات إعادة توازن البيانات. كما قمنا بإعادة النظر في الطرق الحالية وتصنيفها إلى أربع فئات رئيسية: موازنة البيانات، وموازنة الميزات، وموازنة الدالة الخسارة، وموازنة التنبؤات، وذلك وفقًا للمرحلة التي تركز عليها كل خوارزمية ضمن خط أنابيب التدريب.