تعزيز التعرف على الذيل الطويل باستخدام تكثيف CutMix المقارن

غالبًا ما تتبع البيانات الحقيقية توزيع ذيل طويل، حيث تحتل فئات قليلة رأس التوزيع معظم البيانات بينما تحتوي فئات الذيل الكثيرة على عينات محدودة جدًا. في الممارسة العملية، غالبًا ما تظهر النماذج العميقة أداءً ضعيفًا في تعميم الفئات الذيلية بسبب التوزيع غير المتوازن. لحل هذه المشكلة، أصبحت زيادة البيانات طريقة فعالة من خلال إنشاء عينات جديدة للفئات الذيلية. من بين هذه الطرق، واحدة شائعة هي استخدام CutMix الذي يخلط صور الفئات الذيلية والصور الأخرى بشكل صريح، مع بناء العلامات وفقًا لنسبة المساحات المقطوعة من صورتين. ومع ذلك، فإن العلامات القائمة على المساحة تتجاهل تمامًا المعلومات الدلالية الأساسية للعينات المعززة، مما يؤدي غالبًا إلى إشارات تدريب مضللة. لمعالجة هذه القضية، نقترح CutMix التبايني (ConCutMix) الذي يبني عينات معززة ذات علامات دلالية متسقة لتعزيز أداء التعرف على التوزيع ذي الذيل الطويل. بتحديد أكثر، نحسب التشابه بين العينات في الفضاء الدلالي الذي تم تعلمه بواسطة التعلم التبايني، ونستخدمها لتصحيح العلامات القائمة على المساحة. أظهرت التجارب أن ConCutMix الخاص بنا يحسن بشكل كبير الدقة في الفئات الذيلية وكذلك الأداء العام. على سبيل المثال، باستخدام ResNeXt-50، نحسن الدقة العامة في ImageNet-LT بنسبة 3.0% بفضل التحسين الكبير بنسبة 3.3% في الفئات الذيلية. نؤكد أن هذا التحسين يتم عامته أيضًا إلى مقاييس وأطر عمل أخرى وأنماط نماذج مختلفة. يمكن الوصول إلى كودنا والنماذج المدربة مسبقًا عبر الرابط: https://github.com/PanHaulin/ConCutMix.