HyperAIHyperAI
منذ 11 أيام

شبكة عصبية متعددة المدخلات متصلة بشكل كثيف لتصنيف المشاهد الجوية

{Gui-Song Xia, Kai Xu, Han Zhang, Zhili Li, Kun Qin, Qi Bi}
الملخص

على عكس المشاهد الطبيعية، غالبًا ما تتكون المشاهد الجوية من عدد كبير من الكائنات الموزعة بشكل مزدحم على السطح من منظور طائر، مما يتطلب عادةً ميزات تمييزية أكثر وسياقًا محليًا لوصفها. ومع ذلك، عند تطبيقها على تصنيف المشاهد، تميل معظم الشبكات العصبية التلافيفية (ConvNets) الحالية إلى تمثيل السياق العام للصورة، ولا يمكن تجنب فقدان الميزات من المستويات المنخفضة والمتوسطة، خصوصًا مع تعمق النموذج. ولحل هذه التحديات، نقترح في هذا البحث شبكة عصبية تلافيفية متعددة المثيلات متصلة بكثافة (MIDC-Net) لتصنيف المشاهد الجوية. ونُعامل تصنيف المشاهد الجوية كمشكلة تعلم متعددة المثيلات، بحيث يمكن استكشاف السياق المحلي بشكل أعمق. يتكون نموذج التصنيف لدينا من فاصل مثيلات، يتبعه تجميع متعدد المثيلات قابل للتدريب، ثم طبقة تصنيف على مستوى "الحقيبة" (bag-level). في فاصل المثيلات، نقترح بنية توصيل مبسطة وكثيفة لحفظ الميزات من مستويات مختلفة بشكل فعّال. ثم تُحوّل الميزات التلافيفية المستخرجة إلى متجهات ميزات للمثيلات. بعد ذلك، نُقدّم تجميعًا متعدد المثيلات قائمًا على الانتباه وقابلًا للتدريب، والذي يُبرز السياق المحلي المرتبط بملصق المشهد، ويُخرِج احتمالات المستوى "الحقيبة" مباشرةً. وأخيرًا، وباستخدام طبقة التصنيف على مستوى الحقيبة، يخضع هذا الإطار المبني على التعلم متعدد المثيلات للإشراف المباشر على ملصقات الحقيبة. أظهرت التجارب على ثلاث معايير شائعة الاستخدام لتصنيف المشاهد الجوية أن طريقة الاقتراح لدينا تتفوق على العديد من الطرق الرائدة في مجالها بفارق كبير، مع استخدام عدد أقل بكثير من المعلمات.

شبكة عصبية متعددة المدخلات متصلة بشكل كثيف لتصنيف المشاهد الجوية | أحدث الأوراق البحثية | HyperAI