LWGANet: هيكل خفيف للانتباه الجماعي لمهام الاستشعار عن بعد البصرية

المهام البصرية للاستشعار عن بعد (RS) قد اكتسبت أهمية أكاديمية وعملية كبيرة. ومع ذلك، تواجه هذه المهام العديد من التحديات التي تعوق استخراج الخصائص بكفاءة، بما في ذلك كشف وتعرف الأشياء المتعددة التي تظهر تبايناً كبيراً في الحجم ضمن صورة واحدة. بينما كانت استراتيجيات التصميم الثنائية أو متعددة الفروع السابقة فعالة في إدارة هذه الاختلافات في الأشياء، فقد أدت أيضاً إلى زيادة كبيرة في متطلبات الحساب والعدد الإجمالي للمعلمات. نتيجة لذلك، أصبحت هذه العمارة أقل قابلية للتطبيق على الأجهزة ذات الموارد المحدودة. الشبكات الأساسية الخفيفة المعاصرة، المصممة بشكل أساسي للصور الطبيعية، غالباً ما تواجه صعوبات في استخراج الخصائص بكفاءة من الأشياء متعددة الحجم، مما يقوض فعاليتها في المهام البصرية للاستشعار عن بعد. يقدم هذا المقال شبكة LWGANet، وهي شبكة خلفية خفيفة مخصصة للمهام البصرية للاستشعار عن بعد، وتحتوي على وحدة انتباه مجموعات خفيفة جديدة (LWGA) مصممة لت tackling هذه التحديات الخاصة. تعمل وحدة LWGA، المصممة خصيصاً للصور الاستشعارية عن بعد، على استخدام الخصائص الزائدة ببراعة لاستخراج مجموعة واسعة من المعلومات المكانية، من المقاييس المحلية إلى العالمية، دون إدخال تعقيدات إضافية أو زيادة العبء الحسابي. هذا يسهل استخراج الخصائص بدقة عبر مقاييس متعددة ضمن إطار فعال.تم تقييم LWGANet بدقة عبر اثني عشر مجموعة بيانات تغطي أربع مهام بصرية حاسمة للاستشعار عن بعد: تصنيف المشاهد (scene classification)، كشف الأجسام المنحرفة (oriented object detection)، التقسيم الدلالي (semantic segmentation)، وكشف التغيرات (change detection). أكدت النتائج قابلية التطبيق الواسعة لـ LWGANet وقدرتها على الحفاظ على توازن مثالي بين الأداء العالي والتعقيد المنخفض، مما حقق أفضل النتائج المتاحة حالياً (SOTA) عبر مجموعات البيانات المختلفة. ظهرت LWGANet كحل جديد للمواقف ذات الموارد المحدودة التي تتطلب قدرات معالجة صور الاستشعار عن بعد قوية.