Command Palette
Search for a command to run...
LXL: اكتشاف الأجرام ثلاثية الأبعاد المُستبعدة من ليدار باستخدام دمج رادار التصوير أربعي الأبعاد وكاميرا مع تقليل الانحياز
LXL: اكتشاف الأجرام ثلاثية الأبعاد المُستبعدة من ليدار باستخدام دمج رادار التصوير أربعي الأبعاد وكاميرا مع تقليل الانحياز
Weiyi Xiong Jianan Liu Tao Huang Qing-Long Han Yuxuan Xia Bing Zhu
الملخص
بصفتها تقنية ناشئة وجهاز نسبيًا منخفض التكلفة، أثبتت مستشعرات الرادار ثلاثية الأبعاد ذات الزمن (4D imaging radar) فعاليتها بالفعل في الكشف عن الأجسام ثلاثية الأبعاد في أنظمة القيادة الذاتية. ومع ذلك، تعيق كثافة النقاط النادرة وتشوشه في سحابات النقاط الخاصة بالرادار من تحسين الأداء بشكل أكبر، كما يُعدّ غياب الدراسات العميقة حول دمجها مع وسائط أخرى مشكلة حقيقية. من ناحية أخرى، كاستراتيجية جديدة لتحويل وجهة النظر من الصور، تم تطبيق "الاستخلاص" (sampling) في عدد قليل من كاشفات الصور، وأظهرت أداءً أفضل من الاستراتيجية الشائعة المعروفة بـ "الاستحلاب القائم على العمق" (depth-based splatting) المقدمة في نموذج Lift-Splat-Shoot (LSS)، حتى دون الحاجة إلى تنبؤ بعمق الصورة. ومع ذلك، لم تُستغل إمكانات "الاستخلاص" بشكل كامل. تتناول هذه الورقة استراتيجية تحويل وجهة النظر "الاستخلاص" في سياق الكشف عن الأجسام ثلاثية الأبعاد المستند إلى دمج الكاميرا مع الرادار 4D. تم إنشاء نموذج LXL (LiDAR Excluded Lean) الذي يولد خرائط توزيع عمق الصورة المتنبأة، وخرائط امتلاء ثلاثية الأبعاد للرادار، وذلك من خلال ميزات من منظور الصورة (PV) وبيانات منظور الطيارة (BEV) الخاصة بالرادار على التوالي. تُرسل هذه البيانات إلى النواة الأساسية لنموذج LXL، المسمّاة "الاستخلاص القائم على عمق امتلاء الرادار"، لدعم عملية تحويل وجهة النظر من الصورة. وقد أظهرنا أنه يمكن إجراء تحويل وجهة نظر أكثر دقة من خلال دمج معلومات العمق من الصورة ومعلومات الرادار لتعزيز استراتيجية "الاستخلاص". أظهرت التجارب على مجموعتي بيانات VoD وTJ4DRadSet أن الطريقة المقترحة تتفوق بشكل ملحوظ على أحدث الطرق في الكشف عن الأجسام ثلاثية الأبعاد، دون الحاجة إلى إضافات معقدة. كما أثبتت الدراسات التحليلية (ablation studies) أن أداء طريقة البحث يفوق جميع التكوينات المُحسّنة الأخرى.