HyperAIHyperAI
منذ 16 أيام

مُشَرِّع الترميز التلقائي المُقنَّع المُوجَّه بالسمات للتعلُّم الذاتي التلقائي في الاستشعار عن بعد

Yi Wang, Hugo Hernández Hernández, Conrad M Albrecht, Xiao Xiang Zhu
مُشَرِّع الترميز التلقائي المُقنَّع المُوجَّه بالسمات للتعلُّم الذاتي التلقائي في الاستشعار عن بعد
الملخص

لقد لاقت التعلم ذاتي التوجيه بواسطة نمذجة الصور المُغطاة، مثل مُشفّر الصور المُقنّع (MAE)، اهتمامًا واسعًا في تدريب النماذج الأولية للحواسيب البصرية (Vision Transformers) في مجال الاستشعار عن بعد. ومع ذلك، فإن MAE يميل إلى التركيز المفرط على التفاصيل البكسلية، مما يحد من قدرة النموذج على الفهم الدلالي، وخاصةً في صور SAR المضطربة. في هذه الورقة، نستعرض ميزات الصور المستشعرة الطيفية والمكانية كأهداف محسّنة لإعادة بناء MAE. نقوم أولًا بدراسة لإعادة بناء ميزات صور مختلفة، حيث أظهرت جميعها أداءً مُComparable أو أفضل من البكسلات الأصلية. استنادًا إلى هذه الملاحظات، نقترح نموذجًا جديدًا يُدعى مُشفّر الصور المُقنّع المُوجّه بالميزات (FG-MAE): حيث يتم إعادة بناء مجموعة من مخططات التوزيع الموجهة للانحدار (HOG) ومؤشرات الفرق المُوحّدة (NDI) في صور متعددة الطيف، بينما يتم إعادة بناء HOG فقط في صور SAR. تُظهر النتائج التجريبية على ثلاث مهام تطبيقية لاحقة فعالية FG-MAE، مع تحسن ملحوظ خصوصًا في صور SAR. علاوةً على ذلك، نُظهر قابلية التوسع الجيدة المُوروثة لنموذج FG-MAE، ونُطلق أول سلسلة من نماذج الحواسيب البصرية المُدرّبة مسبقًا لصور SAR وصور متعددة الطيف ذات دقة متوسطة.

مُشَرِّع الترميز التلقائي المُقنَّع المُوجَّه بالسمات للتعلُّم الذاتي التلقائي في الاستشعار عن بعد | أحدث الأوراق البحثية | HyperAI