التعلم التبايني الاحتمالي للاعتراف البصري ذي الذيل الطويل

تظهر التوزيعات ذات الذيل الطويل بشكل متكرر في بيانات العالم الحقيقي، حيث تحتوي فئات الأقلية الكثيرة على عدد محدود من العينات. تؤثر هذه المشكلة غير المتكافئة بشكل كبير على أداء خوارزميات التعلم الإشرافي التقليدية، والتي تم تصميمها أساساً للمجموعات التدريبية المتوازنة. كشفت الدراسات الحديثة أن التعلم التبايني الإشرافي يظهر إمكانات واعدة في تخفيف عدم توازن البيانات. ومع ذلك، فإن أداء التعلم التبايني الإشرافي يعاني من تحدي جوهري: فهو يتطلب دفعات تدريبية كبيرة بما يكفي لبناء أزواج تباينية تغطي جميع الفئات، ولكن هذا الشرط صعب تحقيقه في سياق البيانات غير المتكافئة. لتجاوز هذا العائق، نقترح خوارزمية تعلم تبايني احتمالي جديدة (ProCo) تقوم بتقدير توزيع البيانات للعينات من كل فئة في الفضاء الخصائصي، وتعمل على أخذ عينات للأزواج التباينية وفقًا لذلك. بالفعل، تقدير توزيعات جميع الفئات باستخدام الخصائص في دفعة صغيرة، خاصة بالنسبة للبيانات غير المتكافئة، ليس عمليًا. فكرة مفتاحنا هي تقديم افتراض معقول وبسيط بأن الخصائص المُعَدَّلة في التعلم التبايني تتبع مزيجًا من توزيعات فون ميزس-فيشر (vMF) على الفضاء الوحدوي، مما يجلب فوائد ثنائية. أولاً، يمكن تقدير معلمات التوزيع باستخدام اللحظة الأولى فقط للعينة، والتي يمكن حسابها بكفاءة بطريقة مستمرة عبر الدفعات المختلفة. ثانياً، بناءً على التوزيع المقدر، يسمح لنا توزيع vMF بأخذ عينات لا حصر لها من الأزواج التباينية واستنتاج صيغة مغلقة للخسارة المتوقعة للتباين لتحقيق الأمثل بكفاءة. رمز البرمجيات الخاص بنا متاح على الرابط https://github.com/LeapLabTHU/ProCo.