التمييز الدلالي غير المشرف مع التدريب المسبق للصورة واللغة
تقطيع الصور الدلالي بدون إشراف مع التدريب المسبق للصورة واللغة هو مهمة في مجال رؤية الحاسوب تهدف إلى تحقيق تقطيع دلالي على مستوى البكسل من خلال الخصائص المدربة مسبقًا على أزواج الصور النصية، دون استخدام الإشراف الدلالي على مستوى الإنسان. هدف هذه المهمة هو تعلم الحدود والفئات المختلفة للأجسام في الصور تلقائيًا، مما يعزز قدرة النموذج على التعميم في البيانات غير المصنفة. تكمن قيمة تطبيقها في تقليل تكاليف التسمية بشكل كبير وتحسين أداء النموذج على مجموعات بيانات كبيرة، مما يجعلها مناسبة لسيناريوهات مثل القيادة الذاتية وتحليل الصور الطبية.