MaskCD: شبكة كشف التغيرات في الاستشعار عن بعد تعتمد على تصنيف الأقنعة

تم دراسة كشف التغير (CD) من صور الاستشعار عن بعد (RS) باستخدام التعلم العميق على نطاق واسع في الأدبيات العلمية. وعادةً ما يُنظر إلى هذه المهمة على أنها مهمة تصنيف حسب البكسل، تهدف إلى تصنيف كل بكسل على أنه تغير أو لم يتغير. وعلى الرغم من التفوق الذي أظهرته الشبكات المصنفة حسب البكسل ضمن الهياكل المُشفّرة-المُفكّكة (encoder-decoder)، إلا أنها ما زالت تعاني من حدود غير دقيقة وتمييز غير كامل للأجسام في مختلف المشاهد. وبالنسبة لصور RS ذات الدقة العالية، فإن الكائنات التي تغيرت جزئيًا أو كليًا تستحق الاهتمام أكثر من مجرد بكسل واحد. ولهذا السبب، نعيد النظر في مهمة كشف التغير من منظور توقع الأقنعة والتصنيف، ونُقدّم نموذج MaskCD لاكتشاف المناطق المتغيرة من خلال إنشاء أقنعة مصنفة تلقائيًا من أزواج الصور المدخلة. بشكل خاص، يستخدم النموذج مُدركًا تمثيليًا للتغير عبر المستويات (CLCRP) لاستخلاص تمثيلات متعددة المقاييس واعية للتغير، وتحديد العلاقات المكانية الزمنية من خلال الاستفادة من الانتباه الذاتي المتعدد المُتعدّد بالانحناء (DeformMHSA). ثم يُصمم مُفكّك مُعتمد على الانتباه المُقنّع (MA-DETR) لتحديد وتحديد الكائنات المتغيرة بدقة بناءً على آليات الانتباه المُقنّع والانتباه الذاتي. ويُعيد بناء الكائنات المتوقعة من خلال تفكيك التمثيلات البكسلية إلى مقترحات أقنعة قابلة للتعلم، ثم إجراء التنبؤات النهائية من بين هذه المرشحات. وأظهرت النتائج التجريبية على خمسة مجموعات بيانات معيارية أن النهج المقترح يتفوق على النماذج الأخرى من الطراز الرائد. ويمكن الوصول إلى الكود والنماذج المُدرّبة مسبقًا عبر الإنترنت (https://github.com/EricYu97/MaskCD).