تمثيل BEV خالٍ من المعايرة للإدراك البنّائي

كشف الكائنات في الرؤية من الأعلى (BEV) بكفاءة على البنية التحتية يمكن أن يُحسّن بشكل كبير فهم مشاهد المرور والتماسك في الاستشعار بين المركبات والبنية التحتية (V2I). ومع ذلك، تختلف وضعية الكاميرات المثبتة على البنية التحتية، وتعتمد الطرق السابقة للكشف في الرؤية من الأعلى على معايرة دقيقة، وهو أمر صعب في التطبيقات العملية بسبب العوامل الطبيعية الحتمية (مثل الرياح والثلوج). في هذا البحث، نقترح شبكة تمثيل من الأعلى دون معايرة (CBR)، التي تحقق الكشف ثلاثي الأبعاد بناءً على تمثيل من الأعلى دون الحاجة إلى معلمات المعايرة أو إشراف إضافي على العمق. وبشكل محدد، نستخدم نوعين من الشبكات العصبية متعددة الطبقات (MLPs) لفصل السمات من الرؤية الوهمية إلى الرؤية الأمامية والرؤية من الأعلى، تحت إشراف مُوجه بالمناطق المحددة ضمن الصناديق. ثم، يُجرى وحدة دمج السمات عبر الرؤى المختلفة لتماثل السمات من الرؤى المتعامدة، وتُعزز السمات من الرؤية من الأعلى من خلال السمات من الرؤية الأمامية. أظهرت النتائج التجريبية على مجموعة DAIR-V2X أن CBR تحقق أداءً مقبولًا دون الحاجة إلى أي معلمات كاميرا، وهي طبيعياً غير متأثرة بضوضاء المعايرة. نأمل أن تُعد CBR نقطة بداية لبحوث مستقبلية تتناول التحديات العملية المتعلقة بالاستشعار على البنية التحتية.