USB: معيار تعلّم شبه مُراقب موحّد للتصنيف

يُحسّن التعلّم شبه المُشرَّف (SSL) قدرة النموذج على التعميم من خلال استغلال كمّ كبير من البيانات غير المُعلّمة لتعزيز العينات المحدودة المُعلّمة. ومع ذلك، تظل بروتوكولات تقييم SSL الشائعة حاليًا مُقيّدة غالبًا بمجالات الرؤية الحاسوبية (CV). علاوةً على ذلك، تُدرّس الدراسات السابقة الشبكات العصبية العميقة من الصفر عادةً، وهي عملية تستهلك وقتًا طويلاً وتفاقم الأثر البيئي. ولحل هذه المشكلات، قمنا ببناء معيار موحد لتقييم التعلّم شبه المُشرَّف (USB) للتصنيف، من خلال اختيار 15 مهمة متنوعة وصعبة وشاملة من مجالات الرؤية الحاسوبية (CV) ومعالجة اللغة الطبيعية (NLP) ومعالجة الصوت (Audio)، وقمنا بتقييم منهجيات SSL الرائدة بشكل منهجي على هذه المهام، كما أطلقنا كودًا مُعدّلًا وقابلًا للتوسيع مفتوح المصدر لضمان تقييم عادل لهذه الطرق. ونُقدّم أيضًا إصدارات مُدرّبة مسبقًا للنماذج العصبية الرائدة في مجالات الرؤية الحاسوبية لتقليل التكاليف الناتجة عن التحسين اللاحق. يُمكّن USB من تقييم خوارزمية SSL واحدة على عدد أكبر من المهام من مجالات متعددة بتكاليف أقل. على وجه التحديد، يتطلب تقييم خوارزمية FixMatch على 15 مهمة ضمن معيار USB فقط 39 يومًا من وحدة معالجة الرسومات (GPU) على جهاز NVIDIA V100، بينما يتطلب التقييم على 5 مهام في مجال الرؤية الحاسوبية باستخدام TorchSSL 335 يومًا من وحدة معالجة الرسومات (279 يومًا فقط على 4 مجموعات بيانات CV باستثناء ImageNet).