خسارة موزونة بناءً على العدد الفعلي للعينات

مع الزيادة السريعة في حجم البيانات الحقيقية على نطاق واسع، أصبح من الضروري معالجة مشكلة توزيع البيانات ذي الذيل الطويل (أي أن عددًا قليلًا من الفئات يمثل معظم البيانات، بينما تكون معظم الفئات ممثلة تمثيلاً ضعيفاً). تتبني الحلول الحالية عادة استراتيجيات إعادة التوازن بين الفئات مثل إعادة العينات وإعادة الوزن بناءً على عدد الملاحظات لكل فئة. في هذا البحث، ندعي أنه كلما زاد عدد العينات، ستنخفض الفائدة الإضافية للعينة الجديدة المضافة. نقدم إطارًا نظريًا جديدًا لقياس تداخل البيانات من خلال ربط منطقة جوار صغيرة مع كل عينة بدلاً من نقطة واحدة. يتم تعريف العدد الفعال للعينات كحجم العينات ويمكن حسابه باستخدام الصيغة البسيطة $(1-β^{n})/(1-β)$، حيث $n$ هو عدد العينات و$β\in [0,1)$ هو معلمة فائقة. صممنا مخطط إعادة الوزن يستخدم العدد الفعال للعينات لكل فئة لإعادة توازن الخسارة، مما يؤدي إلى خسارة متوازنة بين الفئات. أجريت تجارب شاملة على مجموعات بيانات CIFAR المصطنعة ذات الذيل الطويل وعلى مجموعات بيانات كبيرة مثل ImageNet وiNaturalist. أظهرت نتائجنا أن الشبكة قادرة على تحقيق زيادة كبيرة في الأداء عند التدريب باستخدام الخسارة المتوازنة بين الفئات المقترحة.