تعزيز الأسلوب العدواني لتقسيم المشاهد الحضرية العامة للنطاق

في هذه الورقة، نتناول مشكلة التعميم النطقي في التجزئة الدلالية، والتي تهدف إلى تعلم نموذج قوي باستخدام بيانات مُصَنَّعة مُلَوَّنة فقط (المجال المصدري). ويُتوقع أن يُظهر النموذج أداءً جيدًا على مجالات حقيقية غير مرئية (المجال الهدف). تُظهر دراستنا أن تغير نمط الصور يمكن أن يؤثر بشكل كبير على أداء النموذج، وأن يمكن تمثيل ميزات النمط بشكل جيد من خلال المتوسط والانحراف المعياري لكل قناة في الصور. مستوحين من هذا، نقترح منهجية جديدة تُسمى "التوسيع الأدواتي للنمط" (AdvStyle)، والتي يمكنها إنشاء صور مُصَنَّعة بأسلوب صعب ديناميكيًا أثناء التدريب، وبالتالي تمنع النموذج بشكل فعّال من التأقلم الزائد مع المجال المصدري. وبشكل محدد، يُعامل AdvStyle ميزة النمط كمعلمة قابلة للتعلم، ويُحدَّثَة من خلال التدريب العدواني. وتُستخدم الميزة العدوانية للنمط التي تم تعلّمها لبناء صورة عدوانية لتدريب نموذج قوي. ويُعدّ AdvStyle سهل التنفيذ ويمكن تطبيقه بسهولة على نماذج مختلفة. وقد أظهرت التجارب على بenchmarkين لتحويل التجزئة الدلالية من بيانات مُصَنَّعة إلى حقيقية أن AdvStyle يمكنه تحسين أداء النموذج بشكل كبير على المجالات الحقيقية غير المرئية، كما أظهر أن بإمكاننا تحقيق أفضل النتائج الحالية. علاوة على ذلك، يمكن استخدام AdvStyle في تصنيف الصور العام للنطاقات، ويعطي تحسنًا ملحوظًا على المجموعات المدروسة.