HyperAIHyperAI

Command Palette

Search for a command to run...

خسارة موزونة بناءً على العدد الفعلي للعينات

Yin Cui; Menglin Jia; Tsung-Yi Lin; Yang Song; Serge Belongie

الملخص

مع الزيادة السريعة في حجم البيانات الحقيقية على نطاق واسع، أصبح من الضروري معالجة مشكلة توزيع البيانات ذي الذيل الطويل (أي أن عددًا قليلًا من الفئات يمثل معظم البيانات، بينما تكون معظم الفئات ممثلة تمثيلاً ضعيفاً). تتبني الحلول الحالية عادة استراتيجيات إعادة التوازن بين الفئات مثل إعادة العينات وإعادة الوزن بناءً على عدد الملاحظات لكل فئة. في هذا البحث، ندعي أنه كلما زاد عدد العينات، ستنخفض الفائدة الإضافية للعينة الجديدة المضافة. نقدم إطارًا نظريًا جديدًا لقياس تداخل البيانات من خلال ربط منطقة جوار صغيرة مع كل عينة بدلاً من نقطة واحدة. يتم تعريف العدد الفعال للعينات كحجم العينات ويمكن حسابه باستخدام الصيغة البسيطة (1βn)/(1β)(1-β^{n})/(1-β)(1βn)/(1β)، حيث nnn هو عدد العينات وβ[0,1)β\in [0,1)β[0,1) هو معلمة فائقة. صممنا مخطط إعادة الوزن يستخدم العدد الفعال للعينات لكل فئة لإعادة توازن الخسارة، مما يؤدي إلى خسارة متوازنة بين الفئات. أجريت تجارب شاملة على مجموعات بيانات CIFAR المصطنعة ذات الذيل الطويل وعلى مجموعات بيانات كبيرة مثل ImageNet وiNaturalist. أظهرت نتائجنا أن الشبكة قادرة على تحقيق زيادة كبيرة في الأداء عند التدريب باستخدام الخسارة المتوازنة بين الفئات المقترحة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
خسارة موزونة بناءً على العدد الفعلي للعينات | مستندات | HyperAI