HyperAIHyperAI
منذ 17 أيام

تحسين أداء النموذج وإزالة مشكلة عدم التوازن بين الفئات باستخدام التضخيم

{Dr. Venkateswara Rao Gurrala, Allena Venkata Sai Abhishek}
الملخص

تتألف البيانات في العالم الحقيقي من أنواع متعددة من السمات الصعبة. ومن أكثر هذه السمات شيوعًا هو عدم التوازن بين الفئات، حيث تكون أعداد الأمثلة في الفئات المختلفة ضمن مجموعة البيانات غير متساوية. ويتم معالجة مشكلة عدم التوازن بين الفئات باستخدام تقنيات عينة متنوعة على البيانات. تُعد تقنية التوسيع (Augmentation) إحدى الخطوات الأساسية في أي نموذج تعلم آلي، وتُستخدم لزيادة عدد البيانات الخاصة بالفئات النادرة (الصغيرة). يهدف هذا البحث إلى تحسين أداء النموذج من خلال التغلب على مشكلة عدم التوازن بين الفئات، وذلك باستخدام تقنيات تنويع مختلفة لإنشاء مجموعات بيانات مُعدّلة متوازنة، باستخدام تقنيات تنويع بيانات متنوعة وعينة عشوائية. تم حساب الدقة لكل تقنية تنويع باستخدام نموذج RESNET18. وتم تشغيل النموذج حتى 100 دورة (epochs) لكل حالة، ثم تم مقارنة أفضل دقة تم تحقيقها. وقد أظهرت هذه المقارنة التكرارية بين تقنيات التوسيع رؤى مذهلة حول فعالية مجموعات البيانات المختلفة.