HyperAIHyperAI
منذ 11 أيام

PIDNet: شبكة تصنيف دلالي فعلي الوقت مستوحاة من متحكمات PID

Jiacong Xu, Zixiang Xiong, Shankar P. Bhattacharyya
PIDNet: شبكة تصنيف دلالي فعلي الوقت مستوحاة من متحكمات PID
الملخص

أظهرت بنية الشبكة ذات الفرعين كفاءة وفعالية في مهام التصنيف الدلالي الزمني الفعلي. ومع ذلك، فإن الدمج المباشر بين التفاصيل عالية الدقة والمحتوى من التردد المنخفض يعاني من عيب يتمثل في تراجع الخصائص التفصيلية بسهولة أمام المعلومات السياقية المحيطة. ويُعد هذا الظاهرة المفرطة (overshoot) سببًا رئيسيًا في تقييد تحسين دقة التصنيف لدى النماذج ذات الفرعين الحالية. في هذه الورقة، نربط بين الشبكات العصبية التلافيفية (CNN) ومحولات التناسق النسبي-التكاملي-المشتق (PID)، ونُظهر أن الشبكة ذات الفرعين تكافئ محولًا نسبيًا-تكامليًا (PI)، الذي يعاني بطبيعته من مشاكل مماثلة تتعلق بالظاهرة المفرطة. وللتخفيف من هذه المشكلة، نقترح بنية شبكة ثلاثية فروع جديدة تُسمى PIDNet، التي تتضمن ثلاث فروع تُستخدم لتحليل المعلومات التفصيلية، والمعلومات السياقية، وحدود الصورة على التوالي، وتستخدم انتباه الحدود لتوجيه عملية الدمج بين الفرعين التفصيلي والسياقي. وتُحقق عائلة نماذج PIDNet أفضل توازن بين سرعة الاستدلال والدقة، وتفوق دقتها جميع النماذج الحالية ذات السرعة الاستدلالية المماثلة على مجموعتي بيانات Cityscapes وCamVid. وبشكل خاص، تحقق PIDNet-S دقة قدرها 78.6% من mIOU بسرعة استدلال تبلغ 93.2 إطارًا في الثانية على بيانات Cityscapes، و80.1% من mIOU بسرعة 153.7 إطارًا في الثانية على بيانات CamVid.

PIDNet: شبكة تصنيف دلالي فعلي الوقت مستوحاة من متحكمات PID | أحدث الأوراق البحثية | HyperAI