SFC: المعايرة المشتركة للسمات في التجزئة الدلالية المُشرَّفة ضعيفًا

لقد لاقت التجزئة الشاملة للدلالات المُشَغَّلة ضعفًا على مستوى الصورة اهتمامًا متزايدًا نظرًا لتكاليف التسمية المنخفضة. تعتمد الطرق الحالية بشكل رئيسي على خريطة تنشيط الفئة (CAM) لاستخراج التسميات الوهمية لتدريب نماذج التجزئة الشاملة للدلالات. في هذا العمل، نُظهر لأول مرة أن التوزيع الطويل الذيل (Long-tailed distribution) في بيانات التدريب يمكن أن يؤدي إلى تنشيط زائد في الفئات المُتَقَدِّمة (head classes) وتقليل التنشيط في الفئات المُتَأَخِّرة (tail classes) عند حساب CAM باستخدام أوزان المصنف، وذلك بسبب مشاركة السمات بين الفئات المُتَقَدِّمة والمُتَأَخِّرة. ويؤدي هذا إلى تدهور جودة التسميات الوهمية، مما يؤثر بدوره على أداء التجزئة الشاملة للدلالات النهائية. لمعالجة هذه المشكلة، نقترح طريقة تُسمى "مُعالجة السمات المشتركة" (SFC) لتحسين إنشاء CAM. وبشكل خاص، نستفيد من نماذج الفئات (class prototypes) التي تحمل السمات المشتركة الإيجابية، ونُقدِّم خسارة اتساق متعددة المقاييس ذات وزن توزيعي (MSDW) لتقليل الفجوة بين CAM الناتجة عن أوزان المصنف ونموذج الفئة أثناء التدريب. وتُوازن خسارة MSDW التنشيط الزائد والتنشيط الناقص من خلال معايرة السمات المشتركة في أوزان المصنف الخاصة بالفئات المُتَقَدِّمة والمُتَأَخِّرة. أظهرت النتائج التجريبية أن طريقة SFC تُحسِّن بشكل ملحوظ حدود CAM، وتحقق أداءً جديدًا من أفضل الأداءات الحالية. يمكن الوصول إلى المشروع عبر الرابط: https://github.com/Barrett-python/SFC.