HyperAIHyperAI
منذ 3 أشهر

CUDA: منهجية توليد البيانات التدريبية للتعرف على التوزيعات الطويلة الذيل

Sumyeong Ahn, Jongwoo Ko, Se-Young Yun
CUDA: منهجية توليد البيانات التدريبية للتعرف على التوزيعات الطويلة الذيل
الملخص

تُعد مشكلة عدم التوازن في الفئات شائعة جدًا في المهام الواقعية، ويُعرف أن الخوارزميات العميقة التقليدية تعاني من تدهور الأداء عند استخدام مجموعات تدريب غير متوازنة. ولتخفيف هذه المشكلة، اتجهت العديد من الطرق إلى تحقيق التوازن بين الفئات المعطاة من خلال إعادة توزيع الأوزان أو إعادة أخذ العينات من عينات التدريب. وتُعزز هذه الطرق التأثير الناتج عن الفئات القليلة العدد وتُقلل من تأثير الفئات الغالبة على ناتج النموذج. ومع ذلك، قد تكون التمثيلات المستخلصة ذات جودة ضعيفة بسبب القلة النسبية لعينات الفئات القليلة. وللتعامل مع هذا التقييد، تم تطوير عدة طرق تزيد من تمثيلات عينات الفئات القليلة من خلال الاستفادة من خصائص عينات الفئات الغالبة. وعلى الرغم من الدراسات المكثفة التي أُجريت مؤخرًا، لم تُجرَ أي تحليلات عميقة حول تحديد الفئات التي يجب تعزيزها، أو مدى قوة التعزيز المطلوبة. وفي هذه الدراسة، نقوم أولًا بدراسة العلاقة بين درجة التعزيز ومستوى الأداء حسب الفئة، ونجد أن تخصيص درجة مناسبة من التعزيز لكل فئة هو أمر ضروري لتخفيف مشكلة عدم التوازن بين الفئات. مستندين إلى هذا الاكتشاف، نقترح منهجية جديدة بسيطة وفعالة، تُعرف بـ "CUDA": منهجية تعزيز البيانات للتصنيف طويل الذيل (CUrriculum of Data Augmentation for long-tailed recognition). ويمكن دمج CUDA بسهولة في الطرق الحالية للاعتراف بالتصنيف طويل الذيل. ونُقدّم نتائج تجارب تُظهر أن CUDA تحقق أداءً عامًا أفضل مقارنة بالطريقة الأفضل في مجالها على مجموعة متنوعة من مجموعات البيانات غير المتوازنة، مثل CIFAR-100-LT وImageNet-LT وiNaturalist 2018.

CUDA: منهجية توليد البيانات التدريبية للتعرف على التوزيعات الطويلة الذيل | الأوراق البحثية | HyperAI