إلى نموذج مُحدَّد للتمييز البصري طويل الذيل من منظور سابق

تواجه البيانات الواقعية مشكلة توازن فئات حادة بشكل شائع، وتمتلك توزيعًا طويل الذيل، أي أن معظم العلامات مرتبطة بعدد محدود من الأمثلة. إن النماذج البسيطة المدربة على مثل هذه المجموعات ستُفضّل العلامات السائدة، وستواجه تحديًا جسيمًا في التعميم، وستصبح غير مُحكَمة التقدير. نقترح طريقتين جديدتين من منظور ما قبل (prior) لتخفيف هذا التحدي. أولاً، نستنتج تقنية توليد بيانات مُوجّهة نحو التوازن تُسمى Uniform Mixup (UniMix)، التي تُعزز عملية المزج (mixup) في السياقات ذات التوزيع الطويل الذيل، وتستخدم عوامل مزج متقدمة ومحركات عينة تُفضّل الفئة القليلة العدد. ثانيًا، مستوحاة من نظرية بايز، نحدد ما يُعرف بـ "التحيّز بايز" (Bayias)، وهو تحيّز داخلي ناتج عن عدم اتساق التوزيع السابق، ونُكمّل هذا التحيّز كتعديل على خسارة التباديل القياسية (cross-entropy). ونُثبت لاحقًا أن كلا الطريقتين تضمنان التحقق من التمحيص التصنيفي نظريًا وتجريبيًا. وقد أظهرت تجارب واسعة أن استراتيجياتنا تسهم في بناء نموذج أكثر مُحكَمًا في التقدير، وأن دمج الطرائق يحقق أداءً من الطراز الرائد على مجموعات بيانات CIFAR-LT وImageNet-LT وiNaturalist 2018.