HyperAIHyperAI
منذ 2 أشهر

الليدار الوهمي من تقدير العمق البصري: جسر الفجوة في اكتشاف الأشياء ثلاثية الأبعاد لقيادة المركبات ذاتياً

Wang, Yan ; Chao, Wei-Lun ; Garg, Divyansh ; Hariharan, Bharath ; Campbell, Mark ; Weinberger, Kilian Q.
الليدار الوهمي من تقدير العمق البصري: جسر الفجوة في اكتشاف الأشياء ثلاثية الأبعاد لقيادة المركبات ذاتياً
الملخص

اكتشاف الأشياء ثلاثية الأبعاد هو مهمة أساسية في القيادة الذاتية. تتفوق التقنيات الحديثة بفضل معدلات اكتشاف عالية الدقة، شريطة أن يتم الحصول على البيانات ثلاثية الأبعاد من تقنية ليدار (LiDAR) الدقيقة ولكنها مكلفة. حتى الآن، أدت النهج المستندة إلى الصور الأحادية أو الثنائية الرخيصة إلى دقة أقل بكثير --- فجوة يُعزى عادةً إلى تقدير العمق غير الجيد بناءً على الصور. ومع ذلك، في هذا البحث ندعي أنه ليس جودة البيانات هي التي تفسر معظم الفرق، بل تمثيلها. مع الأخذ في الاعتبار كيفية عمل الشبكات العصبية التلافيفية، نقترح تحويل الخرائط العميقة القائمة على الصور إلى تمثيلات شبه ليدار (Pseudo-LiDAR) --- أي تقليد إشارة الليدار بشكل أساسي. باستخدام هذا التمثيل يمكننا تطبيق خوارزميات الاكتشاف المختلفة القائمة على الليدار. على معيار كيتي (KITTI) الشهير، حققت نظرتنا تحسينات ملحوظة على أحدث ما وصلت إليه التقنيات القائمة على الصور من حيث الأداء --- حيث رفعت دقة اكتشاف الأشياء ضمن نطاق 30 مترًا من 22% في أحدث ما وصلت إليه التقنيات سابقًا إلى 74% غير المسبوقة. عند تقديم البحث، كانت خوارزميتنا تحتل المرتبة الأولى في قائمة أفضل النتائج للاكتشاف ثلاثي الأبعاد في كيتي (KITTI) للنهج القائم على الصور الثنائية. الكود الخاص بنا متاح بشكل عام عبر الرابط: https://github.com/mileyan/pseudo_lidar.