HyperAIHyperAI
منذ 8 أيام

Difficulty-Net: التعلم على توقع الصعوبة للتعرف على التوزيع الطويل الذيل

Saptarshi Sinha, Hiroki Ohashi
Difficulty-Net: التعلم على توقع الصعوبة للتعرف على التوزيع الطويل الذيل
الملخص

تُشكّل مجموعات البيانات ذات التوزيع الطويل الذيل (Long-tailed datasets)، حيث تضم الفئات ذات الرأس (head classes) عددًا كبيرًا جدًا من العينات التدريبية مقارنةً بفئات الذيل (tail classes)، مشكلةً رئيسية في نماذج التعرف، حيث تميل هذه النماذج إلى التحيز تجاه الفئات ذات الرأس. ومن بين الطرق الشائعة لتخفيف هذه المشكلة، يُعد خسارة موزونة (Weighted loss) واحدةً من أكثر الحلول شيوعًا، وقد اقترح عمل حديث أن "صعوبة الفئة" (class-difficulty) قد تكون مؤشرًا أكثر فاعلية من التكرار التقليدي (class-frequency) عند تحديد توزيع الأوزان. ومع ذلك، استخدم العمل السابق صيغة تجريبية (heuristic formulation) لقياس الصعوبة، ووجدنا تجريبيًا أن الصيغة المثلى تختلف حسب خصائص البيانات. لذلك، نقترح نموذجًا يُسمى Difficulty-Net، الذي يتعلم توقع صعوبة الفئات باستخدام أداء النموذج ضمن إطار تعليم متعدد المستويات (meta-learning). ولتمكين النموذج من تقييم صعوبة فئة ما ضمن السياق العام للفئات الأخرى، نُقدّم مفهومين جديدين هما: "الصعوبة النسبية" (relative difficulty) و"خسارة المُحفّز" (driver loss). يُسهم المفهوم الأول في إشراك الفئات الأخرى عند حساب صعوبة فئة معينة، بينما تُعدّ الخسارة الثانية ضرورية لتقديم اتجاه تعليمي معناه ومقصود. أظهرت تجارب واسعة على مجموعات بيانات شهيرة ذات توزيع طويل الذيل فعالية المنهج المقترح، وحقق أداءً يُصنف ضمن أفضل النتائج الحالية (state-of-the-art) على عدة مجموعات بيانات ذات توزيع طويل الذيل.

Difficulty-Net: التعلم على توقع الصعوبة للتعرف على التوزيع الطويل الذيل | أحدث الأوراق البحثية | HyperAI