CW-BASS: تعلُّم مُوجَّه بالحدود وذو وزن مُعتمد على الثقة للترميز الدلالي شبه المُراقب

يهدف التصنيف الدلالي شبه المُراقب (SSSS) إلى تحسين أداء التصنيف من خلال الاستفادة من كميات كبيرة من البيانات غير المُعلَّمة مع عينات مُعلَّمة محدودة. تعاني الطرق الحالية غالبًا من ظاهرة الارتباط (coupling)، حيث يؤدي الاعتماد الزائد على البيانات المُعلَّمة الأولية إلى تعلم غير مثالي؛ كما تعاني من التحيز التأكيدي (confirmation bias)، حيث تُعزز التنبؤات الخاطئة نفسها بشكل متكرر؛ بالإضافة إلى اضبابية الحدود الناتجة عن ضعف الوعي بالحدود وغياب إشارات الحدود الواضحة. لمعالجة هذه المشكلات، نقترح إطارًا جديدًا يُدعى CW-BASS للتصنيف الدلالي شبه المُراقب. ولتقليل تأثير التنبؤات الخاطئة، نُعيّن أوزانًا موثوقة (confidence weights) للعلامات الاصطناعية (pseudo-labels). علاوةً على ذلك، نستفيد من تقنيات تحديد الحدود، التي، رغم استكشافها بشكل واسع في التصنيف الدلالي شبه المُراقب الضعيف (WSSS)، لا تزال غير مُستخدمة بكفاءة في SSSS. وبشكل خاص، يُعدّ منهجنا يحقق ما يلي: (1) تقليل ظاهرة الارتباط من خلال دالة خسارة موزونة بالثقة، التي تُعدّل تأثير العلامات الاصطناعية بناءً على درجات الثقة المُتنبأ بها؛ (2) تخفيف التحيز التأكيدي باستخدام آلية تقييد ديناميكية تتعلم التخلص من العلامات الاصطناعية بناءً على أداء النموذج؛ (3) معالجة اضبابية الحدود باستخدام وحدة واعية بالحدود لتحسين التصنيف بالقرب من حواف الكائنات؛ (4) تقليل ضوضاء العلامات من خلال استراتيجية تناقص الثقة التي تُحسّن تدريجيًا العلامات الاصطناعية أثناء التدريب. أظهرت التجارب الواسعة على مجموعتي بيانات Pascal VOC 2012 وCityscapes أن CW-BASS تحقق أداءً يُعدّ الأفضل على مستوى الحالة الحالية (state-of-the-art). ويشير بشكل خاص إلى أن CW-BASS حقق 65.9% من متوسط دقة التداخل (mIoU) على مدينة Cityscapes ضمن تقسيم صعب وغير مستكشف بشكل كافٍ بنسبة 1/30 (3.3%) (100 صورة)، مما يبرز فعاليته في البيئات ذات عدد محدود من العلامات. يمكن الوصول إلى الكود الخاص بنا عبر الرابط: https://github.com/psychofict/CW-BASS.