Unsupervised Semantic Segmentation With
تقطيع الصور الدلالي بدون إشراف مع التدريب المسبق للصورة واللغة هو مهمة في رؤية الحاسوب تهدف إلى تحقيق تقطيع دلالي على مستوى البكسل من خلال الخصائص التي تم تدريبها مسبقًا على أزواج الصور النصية، دون استخدام الإشراف الدلالي البشري. هدف هذه المهمة هو تعلم الحدود والفئات المختلفة للأجسام في الصور بشكل آلي، مما يعزز قدرة النموذج على التعميم في البيانات غير المصنفة. تكمن قيمة تطبيقها في تقليل تكلفة التسمية بشكل كبير وتحسين أداء النموذج على مجموعات بيانات كبيرة، مما يجعلها مناسبة لسيناريوهات مثل القيادة الذاتية وتحليل الصور الطبية.