HybridSN: استكشاف هرم خصائص CNN ثلاثي الأبعاد وثنائي الأبعاد لتصنيف الصور الفائقة الطيفية

تصنيف الصور الفائقة الطيفية (HSI) يستخدم على نطاق واسع في تحليل الصور المستشعرة عن بعد. تتضمن الصور الفائقة الطيفية حزمًا متغيرة من الصور. يعتبر الشبكة العصبية المتشابكة (CNN) من أكثر الطرق المستخدمة بشكل متكرر القائمة على التعلم العميق لمعالجة البيانات البصرية. كما أن استخدام CNN لتصنيف HSI يظهر أيضًا في الأعمال الحديثة. تعتمد هذه النهج بشكل أساسي على شبكات CNN ثنائية الأبعاد (2D CNN). ومع ذلك، فإن أداء تصنيف HSI يعتمد بشكل كبير على المعلومات المكانية والطيفية معًا. تم استخدام طرق قليلة جدًا للشبكات العصبية المتشابكة ثلاثية الأبعاد (3D CNN) بسبب زيادة التعقيد الحسابي. تقترح هذه الرسالة شبكة عصبية متشابكة فائقة الهجينة (HybridSN) لتصنيف HSI. في الأساس، تتألف HybridSN من شبكة 3D-CNN طيفية-مكانية تليها شبكة 2D-CNN مكانية. تسهل الشبكة 3D-CNN التمثيل المكاني-الطيفي المشترك من كومة الحزم الطيفية. تقوم الشبكة 2D-CNN فوق الشبكة 3D-CNN بتعلم تمثيلات مكانية أكثر مجردة. بالإضافة إلى ذلك، فإن استخدام شبكات CNN الهجينة يقلل من تعقيد النموذج مقارنة باستخدام 3D-CNN بمفردها. لاختبار أداء هذا النهج الهجين، تم إجراء تجارب تصنيف HSI صارمة جدًا على مجموعات بيانات الاستشعار عن بعد لـ Indian Pines و Pavia University و Salinas Scene. تم مقارنة النتائج مع أفضل الطرق التقليدية التي يتم تصميمها باليد وأحدث الطرق القائمة على التعلم العميق من البداية إلى النهاية (end-to-end). تم الحصول على أداء مرضٍ للغاية باستخدام HybridSN المقترحة لتصنيف HSI. يمكن العثور على الكود المصدر في الرابط \url{https://github.com/gokriznastic/HybridSN}.