HyperAI

تقطيع الصور الدلالي بدون إشراف مع التدريب المسبق للصورة واللغة هو مهمة في مجال رؤية الحاسوب تهدف إلى تحقيق تقطيع دلالي على مستوى البكسل من خلال الخصائص المدربة مسبقًا على أزواج الصور النصية، دون استخدام الإشراف الدلالي على مستوى الإنسان. هدف هذه المهمة هو تعلم الحدود والفئات المختلفة للأجسام في الصور تلقائيًا، مما يعزز قدرة النموذج على التعميم في البيانات غير المصنفة. تكمن قيمة تطبيقها في تقليل تكاليف التسمية بشكل كبير وتحسين أداء النموذج على مجموعات بيانات كبيرة، مما يجعلها مناسبة لسيناريوهات مثل القيادة الذاتية وتحليل الصور الطبية.

ADE20K

Cityscapes val