SFA-Net: شبكة تعديل الميزات الدلالية لتقسيم صور الاستشعار عن بعد
أدت التطورات في تقنيات التعلم العميق والرؤية الحاسوبية إلى تأثيرات كبيرة في مجال الاستشعار عن بعد، مما مكّن من تحليل فعّال للبيانات تطبيقات مثل تصنيف تغطية الأرض وكشف التغيرات. وقد استُخدمت شبكات التعميق التلافيفية (CNN) وبنية المحولات (Transformer) في خوارزميات الإدراك البصري بفضل كفاءتها في تحليل السمات المحلية والسياق العالمي. في هذه الورقة، نقترح معمارية مختلطة من المحولات تتكون من معالج مبني على شبكة تعميق تلافيفية (CNN) ومعالج مبني على المحولات. كما نقترح وحدة تعديل السمات التي تُحسّن الخرائط متعددة المقياس التي تم استخلاصها من الشبكة الأساسية EfficientNet. وتُدمج هذه الخرائط المُعدّلة في المعالج المبني على المحولات لتنفيذ التصنيف الدلالي للصور الاستشعارية عن بعد. ونُشير في هذه الورقة إلى المعمارية المقترحة المكونة من معالج ومُفكك باسم شبكة تعديل السمات الدلالية (SFA-Net). ولإثبات فعالية SFA-Net، أُجريت تجارب مفصلة باستخدام أربع مجموعات بيانات معيارية عامة، تشمل مجموعات بيانات UAVid وISPRS Potsdam وISPRS Vaihingen وLoveDA. وقد حقق النموذج المقترح دقةً من المستوى الرائد (state-of-the-art) على مجموعات بيانات UAVid وISPRS Vaihingen وLoveDA في تصنيف الصور الاستشعارية عن بعد. أما على مجموعة بيانات ISPRS Potsdam، فقد حقق أداءً مماثلاً للنموذج الأحدث، مع تقليل عدد المعلمات القابلة للتدريب من 113.8 مليون إلى 10.7 مليون.