Hi-ResNet: تحسين التفاصيل على الحافة لتصنيف الاستشعار عن بعد عالي الدقة

استخلاص الكائنات الأساسية من مناطق التغطية عالية الدقة باستخدام التصنيف الدلالي للتصوير عن بعد عالي الدقة (HRS) يُعد تحديًا كبيرًا. ومع ذلك، فإن الكائنات من الفئة نفسها في صور HRS تُظهر عادةً فروقًا كبيرة في الحجم والشكل عبر البيئات الجغرافية المختلفة، مما يجعل من الصعب تكييف توزيع البيانات. علاوةً على ذلك، يؤدي البيئة الخلفية المعقدة إلى مظهر مشابه للكائنات من فئات مختلفة، ما يؤدي إلى تصنيف عدد كبير من هذه الكائنات خطأً كخلفية. تُعد هذه المشكلات سببًا في أن الخوارزميات الحالية للتعلم ليست مثالية. في هذا العمل، نحل هذه المشكلات من خلال اقتراح شبكة عالية الدقة للتصوير عن بعد (Hi-ResNet) ذات تصميمات بنية فعالة، تتضمن بالترتيب: وحدة قمعية (funnel module)، ووحدة متعددة الفروع مزودة بكتل تجميع معلومات (IA blocks) متعددة الطبقات، ووحدة تحسين الميزات، إلى جانب دالة خسارة مُتَعَلِّقة بالحافة غير المُتعلقة بالفئة (Class-agnostic Edge Aware - CEA). بشكل محدد، نقترح وحدة قمعية لتقليل الحجم (downsample)، مما يقلل من التكلفة الحسابية ويساعد على استخلاص معلومات دلالية عالية الدقة من الصورة الأولية. ثانيًا، نقوم بتقليل حجم الصور المُعالَجة إلى فروع متعددة الدقة بشكل تدريجي لالتقاط الميزات على مقاييس مختلفة، ونطبق كتل IA التي تلتقط المعلومات الكامنة الأساسية باستخدام آليات الانتباه، مما يُعزز تجميع الميزات بكفاءة، ويُميّز بين ميزات الصور ذات الفئة نفسها ولكن بمقاييس وأشكال مختلفة. أخيرًا، تُدمج وحدة تحسين الميزات في دالة الخسارة CEA، التي تُفرّق بين الكائنات من فئات مختلفة ذات أشكال مشابهة، وتحسّن المسافة بين توزيعات البيانات لضمان التنبؤات الصحيحة. وباستخدام استراتيجيات تدريب مُسبق فعّالة، أثبتنا تفوق Hi-ResNet على الطرق الحديثة في مجال التصنيف الدلالي لصور HRS على ثلاث معايير معيارية.