HyperAIHyperAI
منذ 9 أيام

خسارة متوازنة التوزيع للتصنيف متعدد التسميات في مجموعات بيانات طويلة الذيل

Tong Wu, Qingqiu Huang, Ziwei Liu, Yu Wang, Dahua Lin
خسارة متوازنة التوزيع للتصنيف متعدد التسميات في مجموعات بيانات طويلة الذيل
الملخص

نقدم دالة خسارة جديدة تُسمى "Distribution-Balanced Loss" لمشكلات التعرف على العلامات المتعددة التي تُظهر توزيعات فئات طويلة الذيل. بالمقارنة مع مشكلات التصنيف الفردي التقليدية، فإن مشكلات التعرف على العلامات المتعددة غالبًا ما تكون أكثر تحديًا بسبب مشكلتين رئيسيتين: أولًا، تكرار ظهور العلامات معًا (label co-occurrence)، وثانيًا، هيمنة العلامات السلبية (عند اعتبارها مشكلات تصنيف ثنائية متعددة). تُعالج دالة Distribution-Balanced Loss هذه المشكلتين من خلال تعديلين رئيسيين على دالة الخسارة القياسية للتقسيم الثنائي (binary cross-entropy): 1) طريقة جديدة لإعادة توازن الأوزان تأخذ بعين الاعتبار التأثير الناتج عن تكرار ظهور العلامات معًا، و2) تنظيم مقاوم للعلامات السلبية (negative tolerant regularization) لتقليل التأثير المفرط في تقليل العلامات السلبية. أظهرت التجارب على مجموعتي بيانات Pascal VOC وCOCO أن النماذج المدربة باستخدام هذه الدالة الجديدة تحقق تحسينات كبيرة في الأداء مقارنة بالأساليب الحالية. يمكن الوصول إلى الكود والنماذج من خلال الرابط التالي: https://github.com/wutong16/DistributionBalancedLoss.