DP-SSL: نحو التعلم شبه المراقبة المتين مع عدد قليل من العينات المُعلّمة

يُعد نقص البيانات المُصنّفة عقبة حاسمة أمام التعلم العميق. يقدّم التعلم شبه المُشرَّف (SSL) طريقة واعدة لاستغلال البيانات غير المصنفة من خلال تسميات وهمية (Pseudo Labels). ومع ذلك، عند توفر عدد قليل جدًا من العينات المصنفة (مثلاً بضع عينات مصنفة لكل فئة)، يُظهر أداء SSL ضعفًا وانعدام استقرار، وقد يعود ذلك إلى جودة منخفضة للتصنيفات الوهمية المُكتسبة. في هذا البحث، نقترح طريقة جديدة لـ SSL تُسمّى DP-SSL، والتي تعتمد على نموذج برمجة بيانات (DP) مبتكر لإنشاء تسميات احتمالية للبيانات غير المصنفة. على عكس الطرق الحالية لبرمجة البيانات التي تعتمد على خبراء بشر لإعطاء دوال تسمية أولية (LFs)، نطوّر منهجية قائمة على التعلّم متعدد الخيارات (MCL) لاستخلاص دوال التسمية هذه من الصفر بطريقة تتماشى مع نمط التعلم شبه المُشرَّف. وباستخدام التسميات المُشوشة الناتجة عن هذه الدوال، نصمم نموذج تسمية يُعالج التناقضات والتقاطعات بين التسميات المشوهة، ثم نستنتج تسميات احتمالية للعينات غير المصنفة. أظهرت تجارب واسعة على أربع معايير قياسية لـ SSL أن DP-SSL قادرة على توفير تسميات موثوقة للبيانات غير المصنفة، وتحقيق أداءً أفضل في التصنيف على مجموعات الاختبار مقارنة بالطرق الحالية لـ SSL، خاصةً عندما تكون كمية العينات المصنفة صغيرة جدًا. وبشكل محدد، على بيانات CIFAR-10 مع 40 عينة مصنفة فقط، حققت DP-SSL دقة تسمية قدرها 93.82% على العينات غير المصنفة، ودقة تصنيف قدرها 93.46% على مجموعة الاختبار، وهي قيم تفوق النتائج القياسية (SOTA) الحالية.