HyperAIHyperAI

Command Palette

Search for a command to run...

التعرف على التوزيع الطويل الذيل من خلال تكبير المعلومات المتبادلة بين السمات المخفية والعلامات الحقيقية للمنبع

Min-Kook Suh Seung-Woo Seo

الملخص

رغم أن أساليب التعلم التبايني (contrastive learning) أظهرت أداءً متفوقًا في مجموعة متنوعة من مهام تعلم التمثيل، إلا أنها تواجه صعوبات عند استخدام مجموعات بيانات تدريب ذات توزيع طويل الذيل (long-tailed). وقد قام العديد من الباحثين بدمج التعلم التبايني مع تقنية تعديل القيم اللوغاريتمية (logit adjustment) لمعالجة هذه المشكلة، لكن هذه الجمعيات تم تنفيذها بشكل عشوائي (ad-hoc) دون تقديم أساس نظري كافٍ. ويهدف هذا البحث إلى تقديم هذا الأساس النظري وتحسين الأداء بشكل أكبر. أولاً، نُظهر أن السبب الجذري الذي يجعل أساليب التعلم التبايني تعاني في المهام ذات التوزيع الطويل الذيل هو محاولة تحسين القياس المشترك للإنتروبيا (mutual information) بين الميزات المخفية (latent features) والبيانات المدخلة. وبما أن التسميات الصحيحة (ground-truth labels) لا تُؤخذ بعين الاعتبار أثناء هذه العملية، فإنها لا تتمكن من معالجة التوازن بين فئات التصنيف. بدلًا من ذلك، نُفسّر مهمة التعرف على التوزيع الطويل الذيل على أنها مسألة تحسين القياس المشترك للإنتروبيا بين الميزات المخفية والتسميات الصحيحة. ويُمكن من خلال هذا النهج دمج التعلم التبايني وتعديل القيم اللوغاريتمية بشكل سلس، مما يؤدي إلى استخلاص دالة خسارة (loss function) تُظهر أداءً متميزًا على معايير التعرف على التوزيع الطويل الذيل. كما أثبتت هذه الطريقة فعاليتها في مهام التجزئة الصورية (image segmentation)، مما يُؤكد مرونتها وملاءمتها خارج نطاق تصنيف الصور فقط.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التعرف على التوزيع الطويل الذيل من خلال تكبير المعلومات المتبادلة بين السمات المخفية والعلامات الحقيقية للمنبع | مستندات | HyperAI