إعادة التفكير في ك detec tion التغيرات في الاستشعار عن بعد باستخدام منظور التغطية

تهدف كشف التغيرات المستشعرة عن بعد إلى مقارنة صورتين أو أكثر تم تسجيلها لنفس المنطقة ولكن في توقيتات زمنية مختلفة، بهدف تقييم التغيرات في الكيانات الجغرافية والعوامل البيئية بشكل كمي ونوعي. غالبًا ما تُبنى النماذج الشائعة على نماذج كشف التغيرات المعتمدة على كل بكسل على حدة، وهي لا تتحمل تنوع التغيرات الناتجة عن المشاهد المعقدة وتغيرات ظروف التصوير. وللتغلب على هذا العيب، يعيد هذا البحث إعادة تفكير في كشف التغيرات من منظور "القناع" (mask view)، ويعمل على اقتراح ما يلي: 1) هيكلية عامة (meta-architecture) تُسمى CDMask، و2) شبكة من نوع المثيل (instance network) تُسمى CDMaskFormer. تتضمن مكونات CDMask: نواة سايميز (Siamese backbone)، ومستخرج التغيرات (change extractor)، وفكّار البكسل (pixel decoder)، وفكّار الترانسفورمر (transformer decoder)، ومرشح مُعيّن (normalized detector)، مما يضمن الأداء الصحيح لنمط كشف القناع. وبما أن استعلام التغير يمكن تحديثه تلقائيًا استنادًا إلى محتوى السمات الثنائية الزمنية (bi-temporal feature content)، فإن CDMask المقترحة قادرة على التكيف مع توزيعات البيانات الخفية المختلفة، وبالتالي تحديد مناطق التغير ذات الاهتمام بدقة في السياقات المعقدة. وبناءً على ذلك، نقترح شبكة المثيل CDMaskFormer المصممة خصيصًا لمهام كشف التغيرات، والتي تتضمن: (i) مستخرج تغيرات مُنَفَّذ باتباع انتباه تلقائي مبني على التباين المكاني الزمني (Spatial-temporal convolutional attention-based instantiated change extractor)، والذي يُمكّن من التقاط السياق المكاني الزمني مع عمليات خفيفة الوزن؛ و(ii) فكّار ترانسفورمر مُنَفَّذ باتباع انتباه محوري موجه بالمشهد (scene-guided axial attention-instantiated transformer decoder)، والذي يُستخرج تفاصيل مكانيّة أكثر دقة. وقد تم تحقيق أداء من الطراز الرائد (state-of-the-art) لـ CDMaskFormer على خمسة مجموعات بيانات معيارية، مع تحقيق توازن مرضٍ بين الكفاءة والدقة. يُمكن الوصول إلى الشفرة المصدرية من خلال الرابط التالي: https://github.com/xwmaxwma/rschange.