FPGA: إطار تعلم عالمي سريع بدون لصق لتصنيف صور الطيفية الفائقة بالكامل من الطرف إلى الطرف

أدت تقنيات التعلم العميق إلى تحسينات كبيرة في تصنيف الصور فوق الطيفية (HSI). تعتمد النماذج الحالية القائمة على التعلم العميق لتصنيف الصور فوق الطيفية على إطار عمل تعليم مبني على اللوحة، حيث يتم تقسيم الصورة إلى لوحات متداخلة. وبذلك، تكون هذه الأساليب من الأساليب المحلية، والتي تتسم بتكاليف حسابية عالية. في هذه الورقة، تم اقتراح إطار عمل سريع خالٍ من اللوحات للتعلم الشامل (FPGA) لتصنيف الصور فوق الطيفية. في إطار FPGA، يُستخدم شبكة توليد مُدمجة (FCN) تعتمد على المُشفِّر والمُفكِّك لاعتبار المعلومات المكانية الشاملة من خلال معالجة الصورة بالكامل، مما يؤدي إلى استنتاج سريع. ومع ذلك، يصعب استخدام FCN القائمة على المُشفِّر والمُفكِّك مباشرةً لتصنيف الصور فوق الطيفية، نظرًا لفشلها دائمًا في التقارب بسبب انعدام التنوع الكافي في التدرجات الناتجة عن عدد محدود من العينات التدريبية. ولحل مشكلة الانحراف مع الحفاظ على قدرات FCN في الاستنتاج السريع واستكشاف المعلومات المكانية الشاملة، تم اقتراح استراتيجية عشوائية مُقسَّمة على نطاق واسع للعينات أولاً، وذلك من خلال تحويل جميع عينات التدريب إلى تسلسل عشوائي من العينات المُقسَّمة. يمكن لهذه الاستراتيجية الحصول على تدرجات متنوعة لضمان تقارب FCN ضمن إطار FPGA. ولتحسين تصميم بنية FCN، تم اقتراح FreeNet، وهي شبكة كاملة من الطرف إلى الطرف لتصنيف الصور فوق الطيفية، بهدف استغلال المعلومات المكانية الشاملة إلى أقصى حد وتحسين الأداء من خلال مُشفِّر يعتمد على انتباه الطيف ومُفكِّك خفيف الوزن. كما تم تصميم وحدة اتصال جانبية لربط المُشفِّر والمُفكِّك، حيث تدمج التفاصيل المكانية في المُشفِّر مع السمات الدلالية في المُفكِّك. تشير النتائج التجريبية المستمدة من ثلاث مجموعات بيانات معيارية عامة إلى أن إطار FPGA يتفوق على الإطار القائم على اللوحات من حيث السرعة والدقة في تصنيف الصور فوق الطيفية. تم توفير الكود على الرابط التالي: https://github.com/Z-Zheng/FreeNet.