HyperAIHyperAI

Command Palette

Search for a command to run...

جميع الحبوب،.scheme واحدة (AGOS): تعلّم تمثيل المثيل متعدد الحبوب للتصنيف السيني الجوي

Qi Bi Beichen Zhou Kun Qin Qinghao Ye Gui-Song Xia

الملخص

تبقى تصنيف المشاهد الجوية تحديًا كبيرًا نظرًا لأن: 1) حجم الكائنات الأساسية التي تُحدد نمط المشهد يختلف بشكل كبير؛ و2) غالبًا ما تكون هناك كائنات غير ذات صلة بنمط المشهد مُكتظة في الصورة. وبالتالي، فإن كيفية إدراك فعّال لمنطقة الاهتمام (RoIs) بمقاييس متنوعة، وبناء تمثيل أكثر تمييزًا من توزيع الكائنات المعقدة، يُعد أمرًا بالغ الأهمية لفهم المشهد الجوي. في هذه الورقة، نقترح إطار عمل جديد يُسمى "جميع الحبوب، نمط واحد" (AGOS) للتعامل مع هذه التحديات. إلى حد علمنا، يُعد هذا العمل الأول الذي يوسع مفهوم التعلم متعدد المهام (MIL) الكلاسيكي إلى صيغة متعددة الحبوب. ويتكون بشكل خاص من وحدة إدراك متعددة الحبوب (MGP)، ووحدة تمثيل متعددة الفروع ومتعددة المهام (MBMIR)، ووحدة دمج ذاتي التحديد الدلالي (SSF). أولاً، تُحافظ وحدة MGP على ميزات الت convolution المُتعددة التوسع (dilated convolutional) من البنية الأساسية، مما يُضخم المعلومات التمييزية من حبوب متعددة. ثم، تُبرز وحدة MBMIR الكائنات الأساسية في التمثيل متعدد الحبوب ضمن صيغة MIL. وأخيرًا، تسمح وحدة SSF لإطار العمل بتعلم نفس نمط المشهد من تمثيلات الكائنات متعددة الحبوب ودمجها، بحيث يتم تحسين الإطار بأكمله كوحدة متكاملة. ومن الملاحظ أن إطار AGOS يتميز بالمرونة، ويمكن تكييفه بسهولة مع الشبكات العصبية التلافيفية (CNNs) الحالية بطريقة "التركيب والتشغيل" (plug-and-play). وتبين التجارب الواسعة على مجموعات بيانات UCM وAID وNWPU أن AGOS يحقق أداءً مماثلًا لأفضل الطرق الحالية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp