منذ 8 أيام

التعرف على التوزيع الطويل الذيل من خلال تكبير المعلومات المتبادلة بين السمات المخفية والعلامات الحقيقية للمنبع

Min-Kook Suh, Seung-Woo Seo

الملخص

رغم أن أساليب التعلم التبايني (contrastive learning) أظهرت أداءً متفوقًا في مجموعة متنوعة من مهام تعلم التمثيل، إلا أنها تواجه صعوبات عند استخدام مجموعات بيانات تدريب ذات توزيع طويل الذيل (long-tailed). وقد قام العديد من الباحثين بدمج التعلم التبايني مع تقنية تعديل القيم اللوغاريتمية (logit adjustment) لمعالجة هذه المشكلة، لكن هذه الجمعيات تم تنفيذها بشكل عشوائي (ad-hoc) دون تقديم أساس نظري كافٍ. ويهدف هذا البحث إلى تقديم هذا الأساس النظري وتحسين الأداء بشكل أكبر. أولاً، نُظهر أن السبب الجذري الذي يجعل أساليب التعلم التبايني تعاني في المهام ذات التوزيع الطويل الذيل هو محاولة تحسين القياس المشترك للإنتروبيا (mutual information) بين الميزات المخفية (latent features) والبيانات المدخلة. وبما أن التسميات الصحيحة (ground-truth labels) لا تُؤخذ بعين الاعتبار أثناء هذه العملية، فإنها لا تتمكن من معالجة التوازن بين فئات التصنيف. بدلًا من ذلك، نُفسّر مهمة التعرف على التوزيع الطويل الذيل على أنها مسألة تحسين القياس المشترك للإنتروبيا بين الميزات المخفية والتسميات الصحيحة. ويُمكن من خلال هذا النهج دمج التعلم التبايني وتعديل القيم اللوغاريتمية بشكل سلس، مما يؤدي إلى استخلاص دالة خسارة (loss function) تُظهر أداءً متميزًا على معايير التعرف على التوزيع الطويل الذيل. كما أثبتت هذه الطريقة فعاليتها في مهام التجزئة الصورية (image segmentation)، مما يُؤكد مرونتها وملاءمتها خارج نطاق تصنيف الصور فقط.