
أظهرت الدراسات الحديثة أن تقدير العمق من زوج صور استريو يمكن صياغته كمهمة تعلم مراقب لحلها باستخدام شبكات العصبونات التلافيفية (CNNs). ومع ذلك، تعتمد الأطر المعمارية الحالية على شبكات سيامية قائمة على اللوحة، مما يفتقر إلى الوسائل اللازمة لاستغلال معلومات السياق لايجاد التوافق في المناطق غير المحددة بشكل جيد. لمعالجة هذه المشكلة، نقترح PSMNet، وهي شبكة مطابقة استريو هرمية تتكون من وحدتين رئيسيتين: تجميع الهرم المكاني والـ 3D CNN. تقوم وحدة تجميع الهرم المكاني باستغلال قدرة المعلومات السياقية العالمية من خلال تجميع السياق في مقاييس وأماكن مختلفة لتشكيل حجم التكلفة. أما الشبكة العصبية ثلاثية الأبعاد (3D CNN) فتتعلم تنظيم حجم التكلفة باستخدام شبكات الساعة الرملية المتعددة والمكدسة بالاشتراك مع الإشراف الوسيطي. تم تقييم النهج المقترح على عدة مجموعات بيانات مرجعية. قبل الثامن عشر من مارس عام 2018، احتلت طريقتنا المركز الأول في لوحي قيادة KITTI 2012 و 2015. يمكن الوصول إلى شفرات PSMNet عبر الرابط التالي: https://github.com/JiaRenChang/PSMNet.