HyperAIHyperAI
منذ 16 أيام

جميع الحبوب،.scheme واحدة (AGOS): تعلّم تمثيل المثيل متعدد الحبوب للتصنيف السيني الجوي

Qi Bi, Beichen Zhou, Kun Qin, Qinghao Ye, Gui-Song Xia
جميع الحبوب،.scheme واحدة (AGOS): تعلّم تمثيل المثيل متعدد الحبوب للتصنيف السيني الجوي
الملخص

تبقى تصنيف المشاهد الجوية تحديًا كبيرًا نظرًا لأن: 1) حجم الكائنات الأساسية التي تُحدد نمط المشهد يختلف بشكل كبير؛ و2) غالبًا ما تكون هناك كائنات غير ذات صلة بنمط المشهد مُكتظة في الصورة. وبالتالي، فإن كيفية إدراك فعّال لمنطقة الاهتمام (RoIs) بمقاييس متنوعة، وبناء تمثيل أكثر تمييزًا من توزيع الكائنات المعقدة، يُعد أمرًا بالغ الأهمية لفهم المشهد الجوي. في هذه الورقة، نقترح إطار عمل جديد يُسمى "جميع الحبوب، نمط واحد" (AGOS) للتعامل مع هذه التحديات. إلى حد علمنا، يُعد هذا العمل الأول الذي يوسع مفهوم التعلم متعدد المهام (MIL) الكلاسيكي إلى صيغة متعددة الحبوب. ويتكون بشكل خاص من وحدة إدراك متعددة الحبوب (MGP)، ووحدة تمثيل متعددة الفروع ومتعددة المهام (MBMIR)، ووحدة دمج ذاتي التحديد الدلالي (SSF). أولاً، تُحافظ وحدة MGP على ميزات الت convolution المُتعددة التوسع (dilated convolutional) من البنية الأساسية، مما يُضخم المعلومات التمييزية من حبوب متعددة. ثم، تُبرز وحدة MBMIR الكائنات الأساسية في التمثيل متعدد الحبوب ضمن صيغة MIL. وأخيرًا، تسمح وحدة SSF لإطار العمل بتعلم نفس نمط المشهد من تمثيلات الكائنات متعددة الحبوب ودمجها، بحيث يتم تحسين الإطار بأكمله كوحدة متكاملة. ومن الملاحظ أن إطار AGOS يتميز بالمرونة، ويمكن تكييفه بسهولة مع الشبكات العصبية التلافيفية (CNNs) الحالية بطريقة "التركيب والتشغيل" (plug-and-play). وتبين التجارب الواسعة على مجموعات بيانات UCM وAID وNWPU أن AGOS يحقق أداءً مماثلًا لأفضل الطرق الحالية.

جميع الحبوب،.scheme واحدة (AGOS): تعلّم تمثيل المثيل متعدد الحبوب للتصنيف السيني الجوي | أحدث الأوراق البحثية | HyperAI