HyperAIHyperAI
منذ 2 أشهر

فصل التمثيل عن المصنف للاعتراف بذيل طويل

Bingyi Kang; Saining Xie; Marcus Rohrbach; Zhicheng Yan; Albert Gordo; Jiashi Feng; Yannis Kalantidis
فصل التمثيل عن المصنف للاعتراف بذيل طويل
الملخص

تُشكِّل التوزيع الطويل الذيل للعالم البصري تحديات كبيرة للنماذج القائمة على التعلم العميق فيما يتعلق بكيفية التعامل مع مشكلة عدم توازن الفئات. تشمل الحلول الموجودة عادةً استراتيجيات توازن الفئات، مثل إعادة وزن الخسارة، وإعادة العيّنة من البيانات، أو نقل التعلم من فئات الرأس إلى فئات الذيل، ولكن معظمها يلتزم بخطة تعلم التمثيلات والنماذج المصنفة بشكل مشترك. في هذا العمل، نفصل عملية التعلم إلى تعلم التمثيلات وتصنيف، ونستكشف بشكل منهجي كيف تؤثر استراتيجيات التوازن المختلفة عليهما في حالة الاعتراف بالفئات ذات الذيل الطويل. النتائج مدهشة: (1) قد لا يكون عدم توازن البيانات مشكلة في تعلم تمثيلات عالية الجودة؛ (2) باستخدام التمثيلات التي تم تعلمها بواسطة أبسط استراتيجية عيّنة متوازنة (طبيعية)، يمكن أيضًا تحقيق قدرة قوية على الاعتراف بالفئات ذات الذيل الطويل عن طريق تعديل المصنف فقط. نجري تجارب واسعة النطاق ونحقق أداءً جديدًا يتفوق على الأداء الحالي في مقاييس الاعتراف بالفئات ذات الذيل الطويل الشائعة مثل ImageNet-LT وPlaces-LT وiNaturalist، مما يظهر أنه من الممكن أن يتفوق الأسلوب المباشر الذي يفصل بين التمثيل والتصنيف على الخسائر المصممة بدقة واستراتيجيات العيّنة وحتى الوحدات المعقدة التي تعتمد على الذاكرة. رمزنا البرمجي متاح على https://github.com/facebookresearch/classifier-balancing.