التنظيم التبايني للتعلم شبه المراقب

يُعد التماسك التسجيلي على توقعات التصنيف تقنية أساسية في التعلم شبه المراقب، لكنه ما زال يتطلب عددًا كبيرًا من تكرارات التدريب لتحقيق أداء عالٍ. في هذه الدراسة، نحلل أن التماسك التسجيلي يُقيّد انتشار معلومات التصنيف بسبب استبعاد العينات ذات التصنيفات الوهمية غير الموثوقة أثناء تحديثات النموذج. ثم نقترح طريقة التماسك التناقي لتحسين كلاً من الكفاءة والدقة في التماسك التسجيلي من خلال تجميع خصائص البيانات غير المصنفة بشكل جيد. على وجه التحديد، بعد أن يتم تعيين العينات المُضاعفة بشكل قوي إلى مجموعات بناءً على تسمياتها الوهمية، تقوم طريقة التماسك التناقي بتحديث النموذج بحيث تتجه الخصائص ذات التسميات الوهمية الموثوقة نحو تجميع الخصائص في المجموعة نفسها، في حين تُبعد الخصائص في المجموعات المختلفة. وبذلك، يمكن نقل معلومات التسميات الوهمية الموثوقة بشكل فعّال إلى عدد أكبر من العينات غير المصنفة أثناء التدريب من خلال الخصائص المُجمعة جيدًا. وقد أظهرت نتائجنا تحسنًا على معايير مهام التعلم شبه المراقب مقارنة بالطرق السابقة القائمة على التماسك، وحققنا نتائج رائدة في المجال، خاصةً باستخدام عدد أقل من تكرارات التدريب. كما أظهرت طريقة العمل لدينا أداءً متميّزًا وثابتًا في مهام التعلم شبه المراقب المفتوحة، حيث تشمل البيانات غير المصنفة عينات خارج التوزيع.