التمييز الدلالي شبه المشرف عالميًا

في السنوات الأخيرة، ظهرت الحاجة إلى التجزئة الدلالية في العديد من التطبيقات والبيئات المختلفة. ومع ذلك، فإن تكلفة وازدواجية التسمية غالباً ما تحد من كمية البيانات المعلمة المتاحة للتدريب في أي مجال، بينما يكون النشر أسهل إذا عمل نموذج واحد بشكل جيد عبر جميع المجالات. في هذا البحث، نطرح مشكلة جديدة هي التجزئة الدلالية شبه المراقبة الشاملة ونقترح إطار حل لمواجهة الاحتياجات المزدوجة لتقليل تكاليف التسمية والنشر. على عكس البدائل مثل التعديل الدقيق، التدريب المشترك أو التكيف غير المراقب بين المجالات، فإن التجزئة الدلالية شبه المراقبة الشاملة تضمن أن عبر جميع المجالات: (i) يتم نشر نموذج واحد فقط، (ii) يتم استخدام البيانات غير المعلمة، (iii) يتحسن الأداء، (iv) تحتاج فقط إلى عدد قليل من التسميات و (v) قد تختلف فضاءات التسمية. لمعالجة هذا الأمر، نقوم بتصغير الخسائر المراقبة وغير المراقبة داخل المجال وعبر المجالات، مقدمين هدف تنسيق خاص جديد يستند إلى تنظيم الإنتروبية على مستوى البكسل (pixel-aware entropy regularization). نوضح الفوائد الكمية لهذا النهج مقارنة بالطرق الأخرى على عدة مجموعات بيانات للتجزئة في مواقع جغرافية مختلفة (ألمانيا، إنجلترا، الهند) وفي بيئات مختلفة (خارجية، داخلية)، بالإضافة إلى الرؤى النوعية حول التمثيلات المنسقة.