NP-Match: عندما تلتقي العمليات العصبية بالتعلم شبه المراقب

تم استكشاف التعلم شبه المراقب (SSL) على نطاق واسع في السنوات الأخيرة، وهو طريق فعّال لاستغلال البيانات غير المُعلَّمة لتقليل الاعتماد على البيانات المُعلَّمة. في هذه الدراسة، قمنا بتعديل العمليات العصبية (NPs) لتناسب مهمة التصنيف الصوتي شبه المراقب، مما أدى إلى تطوير طريقة جديدة تُسمى NP-Match. تُعد NP-Match مناسبة لهذه المهمة لسببين رئيسيين. أولاً، تقوم NP-Match بمقارنة النقاط البيانات ضمنيًا عند إجراء التنبؤات، وبالتالي تتأثر تنبؤات كل نقطة بيانات غير مُعلَّمة بالنقاط المُعلَّمة المشابهة لها، مما يُحسّن جودة التصنيفات الوهمية (pseudo-labels). ثانيًا، تمتلك NP-Match القدرة على تقدير عدم اليقين، والذي يمكن استخدامه كأداة لاختيار عينات بيانات غير مُعلَّمة ذات تصنيفات وهمية موثوقة. مقارنةً بطرق التعلم شبه المراقب القائمة على عدم اليقين والتي تُطبَّق باستخدام تقنية التقطيع العشوائي مونت كارلو (MC dropout)، فإن NP-Match تُقدّر عدم اليقين بحجم أقل بكثير من التكاليف الحسابية، مما يوفر الوقت في كل من مراحل التدريب والاختبار. أجرينا تجارب واسعة النطاق على أربع مجموعات بيانات عامة، وأظهرت NP-Match أداءً أفضل من النتائج القياسية (SOTA) أو تحققت نتائج تنافسية عليها، مما يُظهر فعالية NP-Match وPotentialها الكبير في مجال التعلم شبه المراقب.