HyperAIHyperAI
منذ 17 أيام

استرِب بُولينغ: إعادة التفكير في التجميع المكاني لتحليل المشهد

Qibin Hou, Li Zhang, Ming-Ming Cheng, Jiashi Feng
استرِب بُولينغ: إعادة التفكير في التجميع المكاني لتحليل المشهد
الملخص

أثبت التجميع المكاني فعالية كبيرة في استخلاص المعلومات السياقية على مدى مسافات طويلة لمهام التنبؤ على مستوى كل بكسل، مثل تحليل المشهد. في هذا البحث، وبالإضافة إلى التجميع المكاني التقليدي الذي يمتلك عادةً شكلًا منتظمًا بحجم NxN، نعيد التفكير في صياغة التجميع المكاني من خلال تقديم استراتيجية تجميع جديدة تُسمى "التجميع الشريطي"، والتي تأخذ بعين الاعتبار نواة طويلة ولكن ضيقة، أي بحجم 1xN أو Nx1. وباستخدام التجميع الشريطي، نستكشف بشكل أعمق تصميم بنية التجميع المكاني من خلال: 1) إدخال وحدة تجميع شريطي جديدة تمكّن الشبكات الأساسية من نمذجة الاعتماديات على مدى مسافات طويلة بكفاءة، 2) عرض كتلة بناء جديدة تعتمد على تجميع مكاني متنوع كعمود فقري رئيسي، و3) مقارنة منهجية للأداء بين التجميع الشريطي المقترح والتجميع المكاني التقليدي. وتشير النتائج إلى أن كلا التصميمين القائمين على التجميع هما خفيفي الوزن، ويمكنهما العمل كوحدات جاهزة للإدخال والتشغيل (plug-and-play) في الشبكات الحالية لتحليل المشهد. وقد أظهرت التجارب الواسعة على معايير شهيرة (مثل ADE20K وCityscapes) أن نهجنا البسيط يحقق نتائج جديدة على مستوى الحد الأقصى من الأداء (state-of-the-art). وتم توفير الشفرة المصدرية على الرابط: https://github.com/Andrew-Qibin/SPNet.

استرِب بُولينغ: إعادة التفكير في التجميع المكاني لتحليل المشهد | أحدث الأوراق البحثية | HyperAI