الترقية المستندة إلى الموقع للتحليل الدلالي

لقد مكّنت العديد من أهداف التعلم الناجحة، مثل تقليل خسارة دايس (Dice Loss) وفقدان الانتروبيا المتقاطعة (Cross-Entropy Loss)، من تحقيق تقدّم غير مسبوق في مهام التجزئة. وبالإضافة إلى هذه المقاييس الدلالية، يهدف هذا البحث إلى إدخال إشراف المكان في التجزئة الدلالية. استنادًا إلى هذه الفكرة، نقدّم طريقة تُسمى "استرجاع مُدرك للمكان" (Location-aware Upsampling - LaU)، التي تُعدّل بشكل تكيفي إحداثيات التداخل باستخدام انزياحات قابلة للتدريب. ثم نُنشئ خسائر مُدركَة للمكان من خلال تشجيع البكسلات على الانتقال نحو مواقع مصنّفة بشكل جيد. يتكوّن LaU من تنبؤ بالانزياحات مرتبط بالتداخل، ويتم تدريبه بشكل متكامل (end-to-end) لإنتاج درجة ثقة عند كل موقع، بدءًا من المستوى الخشن وصولًا إلى المستوى الدقيق. وبتوجيه من الخسائر المُدركَة للمكان، يمكن للوحدة الجديدة أن تحل محل نسخة بسيطة مماثلة (مثل التداخل الخطي) بطريقة متوافقة وسهلة الاستخدام (plug-and-play)، مما يعزز بشكل إضافي الأدوات الرائدة من نوع المُشفّر-المُفكّك (encoder-decoder). وقد أكدت التجارب الواسعة التحسين المستمر مقارنةً بالأساليب الرائدة على مجموعات البيانات القياسية. يُمكن الاطلاع على الكود الخاص بنا عبر الرابط التالي: https://github.com/HolmesShuan/Location-aware-Upsampling-for-Semantic-Segmentation