الخسارة غير المتماثلة للتصنيف متعدد العلامات

في البيئة النموذجية متعددة التسميات، يحتوي الصورة في المتوسط على عدد قليل من التسميات الإيجابية، وعدد كبير من التسميات السلبية. يؤدي هذا التوازن غير المتوازن بين الإيجابية والسلبية إلى تأثير كبير على عملية التحسين، ويمكن أن يؤدي إلى إضعاف تدرجات التسميات الإيجابية أثناء التدريب، مما يسبب دقة منخفضة. في هذه الورقة، نقدم خسارة غير متزنة جديدة تُعرف بـ "ASL"، والتي تعمل بشكل مختلف على العينات الإيجابية والسلبية. تُمكّن هذه الخسارة من تقليل وزن العينات السلبية السهلة ديناميكيًا، وتطبيق حد أقصى صارم على هذه العينات، كما تتيح أيضًا التخلص من العينات التي قد تكون مُسمّاة بشكل خاطئ. نُظهر كيف يمكن لـ ASL تحقيق توازن في احتمالات العينات المختلفة، وكيف يتم تحويل هذا التوازن إلى تحسين في نقاط التقييم mAP. باستخدام ASL، نحقق نتائج متقدمة على أداء عالمي في عدة مجموعات بيانات متعددة التسميات شهيرة: MS-COCO، Pascal-VOC، NUS-WIDE، وOpen Images. كما نُظهر إمكانية تطبيق ASL على مهام أخرى مثل التصنيف أحادي التسمية والكشف عن الكائنات. تُعد ASL فعالة، وسهلة التنفيذ، ولا تزيد من زمن التدريب أو التعقيد.يمكن الاطلاع على التنفيذ من خلال: https://github.com/Alibaba-MIIL/ASL.