HyperAIHyperAI
منذ 2 أشهر

دفاعًا عن التسمية الوهمية: إطار اختيار التسميات الوهمية واعٍ للغموض للتعلم شبه المشرف عليه

Mamshad Nayeem Rizve; Kevin Duarte; Yogesh S Rawat; Mubarak Shah
دفاعًا عن التسمية الوهمية: إطار اختيار التسميات الوهمية واعٍ للغموض للتعلم شبه المشرف عليه
الملخص

البحث الحديث في التعلم شبه المشرف (Semi-Supervised Learning - SSL) يهيمن عليه بشكل كبير الأساليب المستندة إلى تنظيم الاستقرار (Consistency Regularization)، والتي تحقق أداءً قويًا. ومع ذلك، فإن هذه الأساليب تعتمد بشكل كبير على عمليات زيادة البيانات الخاصة بالمنطقة (Domain-Specific Data Augmentations)، وهي ليست سهلة الإنتاج لجميع أنماط البيانات. تعتبر تقنية التسمية الوهمية (Pseudo-Labeling - PL) نهجًا عامًا للتعلم شبه المشرف لا يواجه هذا القيود، لكنها تؤدي بشكل نسبي ضعيف في صيغتها الأصلية. نعتقد أن سبب ضعف أداء PL يكمن في التوقعات عالية الثقة والخاطئة من النماذج غير المحسسة؛ هذه التوقعات تولد العديد من التسميات الوهمية الخاطئة، مما يؤدي إلى تدريب ملوث بالضوضاء. نقترح إطار عمل اختيار التسميات الوهمية مع الوعي بالشكوك (Uncertainty-Aware Pseudo-Label Selection - UPS)، والذي يحسن دقة التسمية الوهمية بخفض كبير لكمية الضوضاء التي تواجهها عملية التدريب. بالإضافة إلى ذلك، يعمم UPS عملية التسمية الوهمية، مما يتيح إنشاء تسميات وهمية سلبية؛ يمكن استخدام هذه التسميات السلبية في تصنيف متعدد العلامات وكذلك في التعلم السلبي لتحسين تصنيف العلامة الواحدة. نحقق أداءً قويًا عند مقارنتنا بالأساليب الحديثة للتعلم شبه المشرف على مجموعات البيانات CIFAR-10 وCIFAR-100. كما نوضح مرونة طريقتنا على مجموعة بيانات الفيديو UCF-101 وعلى مجموعة بيانات Pascal VOC المتعددة العلامات.

دفاعًا عن التسمية الوهمية: إطار اختيار التسميات الوهمية واعٍ للغموض للتعلم شبه المشرف عليه | أحدث الأوراق البحثية | HyperAI