التمييز الدلالي شبه المشرف مع التوافق بين المستويات العالية والمنخفضة

القدرة على فهم المعلومات البصرية من بيانات مصنفة بشكل محدود هي جانب مهم من جوانب التعلم الآلي. بينما تم دراسة تصنيف الصور على مستوى الصورة بشكل واسع في إعداد نصف مشرف، فإن التصنيف الكثيف على مستوى البكسل مع بيانات محدودة قد اجتذب الاهتمام مؤخرًا فقط. في هذا العمل، نقترح نهجًا للتقسيم الدلالي نصف المشرف الذي يتعلم من عينات مصنفة بكسلات قليلة بينما يستفيد من صور إضافية غير مشمولة بالتصنيف. يستخدم هذا النهج فرعين شبكيين يربطان بين تصنيف نصف مشرف وتقسيم نصف مشرف، بما في ذلك التدريب الذاتي. يقلل النهج ذو الفرعين من الأخطاء الشائعة على المستويين المنخفض والمرتفع التي تحدث عادة عند التدريب باستخدام عدد قليل من العلامات. يحقق هذا النهج تحسينًا كبيرًا على الطرق الموجودة، خاصة عند التدريب باستخدام عينات مشمولة بالتصنيف قليلة جدًا. وعلى عدة مقاييس قياسية - PASCAL VOC 2012 (باسكال فوك 2012)، PASCAL-Context (باسكال-كونتكست)، و Cityscapes (سيتيسكيبس) - يتمكن هذا النهج من تحقيق أحدث ما وصل إليه العلم في مجال التعلم نصف المشرف.