ChangeMamba: كشف التغيرات عن بعد باستخدام نموذج الفضاء الحالة المكاني-زماني

حققت شبكات العصب المتشابكة المتلافهة (CNN) ومتغيرات (Transformers) تقدماً ملحوظاً في مجال كشف التغييرات عن بعد (CD). ومع ذلك، فإن لكل من هذين الهيكلين عيوبًا جوهرية: يُقيَّد شبكات العصب المتشابكة المتلافية بمجال استقبال محدود قد يعيق قدرتها على التقاط السياقات المكانية الأوسع، بينما تكون متغيرات مكثفة حاسوبياً، مما يجعل تدريبها وتطبيقها على مجموعات بيانات كبيرة باهظة الثمن. مؤخراً، أظهرت بنية Mamba، التي تعتمد على نماذج الفضاء الحالة، أداءً ملحوظاً في سلسلة من مهام معالجة اللغة الطبيعية، والتي يمكن أن تعوض بفعالية عن عيوب البنية المذكورة أعلاه. في هذا البحث، نستكشف لأول مرة إمكانات بنية Mamba في مهام كشف التغييرات عن بعد (CD). نقوم بتكييف الإطارات المرتبطة بها، والتي تُسمى MambaBCD وMambaSCD وMambaBDA، للكشف الثنائي عن التغيير (BCD)، وكشف التغيير الدلالي (SCD)، وتقييم الأضرار في المباني (BDA) على التوالي. تتبنى جميع الإطارات الثلاثة أحدث بنية Visual Mamba كمُشفر، مما يسمح بتعلم كامل للمعلومات السياقية المكانية العالمية من الصور المدخلة. بالنسبة لمفكك التغيير، الذي يوجد في جميع الثلاثة هيكلات، نقترح ثلاثة آليات لنمذجة العلاقات الزمانية-المكانية التي يمكن دمجها بشكل طبيعي مع بنية Mamba واستغلال خصائصها بالكامل لتحقيق تفاعل زماني-مكاني للخصائص الزمنية المتعددة والحصول بالتالي على معلومات دقيقة للتغيير. على خمسة مجموعات بيانات مقاييسة، حققت الإطارات المقترحة لدينا أفضل النتائج بالمقارنة مع الطرق الحالية القائمة على شبكات العصب المتشابكة المتلافية ومتغيرات دون استخدام أي استراتيجيات تدريب معقدة أو حيل، مما يثبت بشكل كامل إمكانات بنية Mamba في مهام CD. تجارب إضافية أظهرت أن هندستنا مقاومة للغاية للبيانات المهترئة. سيتم توفير الكود المصدر في https://github.com/ChenHongruixuan/MambaCD