توليد الميزات للتصنيف طويل đu尾

تُظهر العالم البصري بشكل طبيعي عدم توازن في عدد حالات الكائنات أو المشاهد، مما يؤدي إلى توزيع طويل الذيل (long-tailed distribution). يُشكل هذا عدم التوازن تحديًا كبيرًا للنماذج التصنيفية المستندة إلى التعلم العميق. يُحاول تكرار عينات فئات الذيل (tail classes) حل هذه المشكلة، لكن النقص في التنوع البصري يُنتج شبكة ذات قدرة تمثيلية ضعيفة. يُعد الحل البسيط لهذا التحدي هو فصل شبكات التمثيل (representation) والتصنيف (classifier)، واستخدام تكرار العينات فقط لتدريب شبكية التصنيف. في هذا البحث، بدلًا من إعادة عينة الصورة نفسها مرارًا وتكرارًا (وهو ما يؤدي إلى تكرار الميزات نفسها)، نستكشف مسارًا يهدف إلى إنتاج ميزات ذات معنى من خلال تقدير توزيع الفئة ذات الذيل. مستوحى من أفكار العمل الحديث في التعلم بعينات قليلة (few-shot learning)، ننشئ توزيعات مُعدَّلة (calibrated distributions) لاستخلاص ميزات إضافية تُستخدم لاحقًا في تدريب شبكية التصنيف. من خلال سلسلة من التجارب على مجموعة بيانات CIFAR-100-LT (طويلة الذيل) بعوامل عدم توازن مختلفة، وعلى مجموعة mini-ImageNet-LT (طويلة الذيل)، نُظهر فعالية نهجنا ونُحقِّق حالة جديدة من الأداء الأفضل (state-of-the-art). كما نقدم تحليلًا نوعيًا للميزات المُولَّدة باستخدام تصورات t-SNE، ونحلل الجيران الأقرب المستخدمين لضبط توزيعات الفئات ذات الذيل. يمكن الوصول إلى الكود الخاص بنا عبر الرابط: https://github.com/rahulvigneswaran/TailCalibX.