HyperAIHyperAI
منذ 11 أيام

HSI-BERT: التصنيف الصوتي الطيفي باستخدام التمثيل الثنائي الاتجاه من مُشفّر المحولات

{Wei Li, Mengmeng Zhang, HongWei Yang, Lina Zhao, Ji He}
الملخص

تم استخدام الطرق العميقة للتعلم على نطاق واسع في تصنيف الصور فوق الطيفية، وقد حققت أداءً متميزًا على مستوى الحد الأقصى من الأداء. ومع ذلك، تُعاني الطرق الحالية للتعلم العميق من قيود تشمل مجال الاستقبال المحدود، وعدم المرونة، وصعوبة التعميم في تصنيف الصور فوق الطيفية. ولحل هذه المشكلات، نقترح نموذج HSI-BERT، حيث ترمز BERT إلى تمثيلات المشغل الثنائي الاتجاه المستمدة من نماذج المحولات (Transformers)، وترمز HSI إلى الصور فوق الطيفية. يتميز النموذج المقترح HSI-BERT بوجود مجال استقبال عالمي، مما يمكّنه من التقاط الاعتماديات العالمية بين البكسلات بغض النظر عن المسافة المكانية بينها. كما يتميز HSI-BERT بالمرونة العالية، مما يتيح إدخال مناطق مدخلات مرنة وديناميكية. علاوةً على ذلك، يتمتع HSI-BERT بقدرة تعميم جيدة، إذ يمكن للنموذج المدرب معًا أن يُعمم على مناطق ذات أشكال مختلفة دون الحاجة إلى إعادة التدريب. يُبنى HSI-BERT بشكل أساسي على آلية الانتباه الذاتي متعدد الرؤوس (MHSA) في طبقة MHSA. علاوةً على ذلك، يتعلم النموذج عدة أنواع من الانتباه عبر رؤوس مختلفة، حيث يقوم كل رأس في طبقة MHSA بتشفير تمثيلات واعية بالسياق الدلالي للحصول على ميزات تمييزية. وبما أن جميع الميزات المُشفَّرة من الرؤوس تُدمج معًا، فإن الميزات الناتجة تُظهر معلومات مكانية-طيفية ضرورية لتصنيف دقيق على مستوى البكسل. أظهرت النتائج الكمية والكيفية أن HSI-BERT يتفوق على جميع النماذج القائمة على الشبكات العصبية التلافيفية (CNN) من حيث دقة التصنيف والوقت الحسابي، ويحقق أداءً متميزًا على مستوى الحد الأقصى من الأداء على ثلاث مجموعات بيانات شائعة جدًا للصور فوق الطيفية.

HSI-BERT: التصنيف الصوتي الطيفي باستخدام التمثيل الثنائي الاتجاه من مُشفّر المحولات | أحدث الأوراق البحثية | HyperAI