HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة عصبية متعددة المدخلات متصلة بشكل كثيف لتصنيف المشاهد الجوية

Gui-Song Xia Kai Xu Han Zhang Zhili Li Kun Qin Qi Bi

الملخص

على عكس المشاهد الطبيعية، غالبًا ما تتكون المشاهد الجوية من عدد كبير من الكائنات الموزعة بشكل مزدحم على السطح من منظور طائر، مما يتطلب عادةً ميزات تمييزية أكثر وسياقًا محليًا لوصفها. ومع ذلك، عند تطبيقها على تصنيف المشاهد، تميل معظم الشبكات العصبية التلافيفية (ConvNets) الحالية إلى تمثيل السياق العام للصورة، ولا يمكن تجنب فقدان الميزات من المستويات المنخفضة والمتوسطة، خصوصًا مع تعمق النموذج. ولحل هذه التحديات، نقترح في هذا البحث شبكة عصبية تلافيفية متعددة المثيلات متصلة بكثافة (MIDC-Net) لتصنيف المشاهد الجوية. ونُعامل تصنيف المشاهد الجوية كمشكلة تعلم متعددة المثيلات، بحيث يمكن استكشاف السياق المحلي بشكل أعمق. يتكون نموذج التصنيف لدينا من فاصل مثيلات، يتبعه تجميع متعدد المثيلات قابل للتدريب، ثم طبقة تصنيف على مستوى "الحقيبة" (bag-level). في فاصل المثيلات، نقترح بنية توصيل مبسطة وكثيفة لحفظ الميزات من مستويات مختلفة بشكل فعّال. ثم تُحوّل الميزات التلافيفية المستخرجة إلى متجهات ميزات للمثيلات. بعد ذلك، نُقدّم تجميعًا متعدد المثيلات قائمًا على الانتباه وقابلًا للتدريب، والذي يُبرز السياق المحلي المرتبط بملصق المشهد، ويُخرِج احتمالات المستوى "الحقيبة" مباشرةً. وأخيرًا، وباستخدام طبقة التصنيف على مستوى الحقيبة، يخضع هذا الإطار المبني على التعلم متعدد المثيلات للإشراف المباشر على ملصقات الحقيبة. أظهرت التجارب على ثلاث معايير شائعة الاستخدام لتصنيف المشاهد الجوية أن طريقة الاقتراح لدينا تتفوق على العديد من الطرق الرائدة في مجالها بفارق كبير، مع استخدام عدد أقل بكثير من المعلمات.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكة عصبية متعددة المدخلات متصلة بشكل كثيف لتصنيف المشاهد الجوية | مستندات | HyperAI