HyperAIHyperAI
منذ 9 أيام

تعلم الميزات الثابتة للتصنيف الطويل المعمم المائل

Kaihua Tang, Mingyuan Tao, Jiaxin Qi, Zhenguang Liu, Hanwang Zhang
تعلم الميزات الثابتة للتصنيف الطويل المعمم المائل
الملخص

تُركّز الطرق الحالية لتصنيف الطبقات الطويلة (LT) فقط على معالجة عدم التوازن بين الفئات، حيث تمتلك الفئات الرئيسية عدداً أكبر من العينات مقارنةً بالفئات الذيلية، لكنها تتجاهل عدم التوازن من حيث السمات. في الواقع، حتى إذا كان التوزيع بين الفئات متوازناً، فقد تظل العينات داخل كل فئة موزعة بشكل طولي بسبب تباين السمات. وتجدر الإشارة إلى أن هذا النوع الأخير من عدم التوازن أكثر شيوعاً وتعقيداً من النوع الأول، وذلك لأن السمات ليست فقط غير ظاهرة في معظم مجموعات البيانات، بل أيضاً معقدة بشكل توليفي، ما يجعل موازنتها مكلفة للغاية ومستحيلة عملياً. لذلك، نقدّم مشكلة بحثية جديدة تُسمى: التصنيف الطولي العام (GLT)، بهدف النظر في كلا نوعي عدم التوازن معًا. وعندما نقول "عام"، فإننا نقصد أن يجب أن تكون طريقة GLT قادرة على حل مشكلة LT التقليدية بشكل طبيعي، ولكن ليس العكس. ومن غير مفاجئ أن نجد أن معظم الطرق التي تركز على التوازن بين الفئات تنهار في المعايير المُقترحة لدينا: ImageNet-GLT وMSCOCO-GLT. ونُبرر ذلك بأن هذه الطرق تُبالغ في تعديل توزيع الفئات، بينما تتجاهل تعلّم ميزات غير حساسة للسمات. لمعالجة هذا التحدي، نقترح طريقة جديدة تُسمى تعلّم الميزات الثابتة (IFL)، وهي أول معيار قوي لمشكلة GLT. تبدأ طريقة IFL باكتشاف بيئات ذات توزيعات داخلية فئوية مختلفة من خلال التنبؤات غير المثالية، ثم تتعلم ميزات ثابتة عبر هذه البيئات. وتبدي النتائج واعدة، حيث تعمل IFL كمُكوّن أساسي مُحسّن لجميع خطوط العمل في تصنيف الطبقات الطويلة: إعادة توازن من مرحلة واحدة أو مرحلتين، والتوسيع، والتركيب. يمكن الوصول إلى الشيفرة والمعاير على GitHub عبر الرابط التالي: https://github.com/KaihuaTang/Generalized-Long-Tailed-Benchmarks.pytorch