HyperAIHyperAI

Command Palette

Search for a command to run...

الليدار الوهمي من تقدير العمق البصري: جسر الفجوة في اكتشاف الأشياء ثلاثية الأبعاد لقيادة المركبات ذاتياً

Yan Wang Wei-Lun Chao Divyansh Garg Bharath Hariharan Mark Campbell Kilian Q. Weinberger

الملخص

اكتشاف الأشياء ثلاثية الأبعاد هو مهمة أساسية في القيادة الذاتية. تتفوق التقنيات الحديثة بفضل معدلات اكتشاف عالية الدقة، شريطة أن يتم الحصول على البيانات ثلاثية الأبعاد من تقنية ليدار (LiDAR) الدقيقة ولكنها مكلفة. حتى الآن، أدت النهج المستندة إلى الصور الأحادية أو الثنائية الرخيصة إلى دقة أقل بكثير --- فجوة يُعزى عادةً إلى تقدير العمق غير الجيد بناءً على الصور. ومع ذلك، في هذا البحث ندعي أنه ليس جودة البيانات هي التي تفسر معظم الفرق، بل تمثيلها. مع الأخذ في الاعتبار كيفية عمل الشبكات العصبية التلافيفية، نقترح تحويل الخرائط العميقة القائمة على الصور إلى تمثيلات شبه ليدار (Pseudo-LiDAR) --- أي تقليد إشارة الليدار بشكل أساسي. باستخدام هذا التمثيل يمكننا تطبيق خوارزميات الاكتشاف المختلفة القائمة على الليدار. على معيار كيتي (KITTI) الشهير، حققت نظرتنا تحسينات ملحوظة على أحدث ما وصلت إليه التقنيات القائمة على الصور من حيث الأداء --- حيث رفعت دقة اكتشاف الأشياء ضمن نطاق 30 مترًا من 22% في أحدث ما وصلت إليه التقنيات سابقًا إلى 74% غير المسبوقة. عند تقديم البحث، كانت خوارزميتنا تحتل المرتبة الأولى في قائمة أفضل النتائج للاكتشاف ثلاثي الأبعاد في كيتي (KITTI) للنهج القائم على الصور الثنائية. الكود الخاص بنا متاح بشكل عام عبر الرابط: https://github.com/mileyan/pseudo_lidar.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp