HyperAIHyperAI

Command Palette

Search for a command to run...

PIXOR: الكشف عن الأشياء ثلاثية الأبعاد في الوقت الفعلي من السحابات النقطية

Bin Yang Wenjie Luo Raquel Urtasun

الملخص

نعالج مشكلة الكشف عن الأشياء ثلاثية الأبعاد في الوقت الحقيقي من السحب النقطية في سياق القيادة الذاتية. تعتبر سرعة الحساب أمرًا حاسمًا حيث أن الكشف هو مكون ضروري للأمان. ومع ذلك، فإن الأساليب الحالية تكون باهظة التكلفة من حيث الحساب بسبب البعد العالي للسحب النقطية. نستخدم البيانات ثلاثية الأبعاد بشكل أكثر كفاءة من خلال تمثيل المشهد من وجهة النظر الطائر (Bird's Eye View - BEV)، ونقترح PIXOR، وهو كاشف بدون اقتراحات ومرحلة واحدة ينتج تقديرات للأجسام ثلاثية الأبعاد الموجهة التي يتم تفكيكها من التنبؤات العصبية على مستوى البكسل. تم تصميم تمثيل الإدخال، هندسة الشبكة، وتحسين النموذج خصيصًا لموازنة الدقة العالية وكفاءة الوقت الحقيقي. نتحقق من صحة PIXOR على قاعدتين بيانات: معيار كشف الأجسام من وجهة النظر الطائر (BEV) في KITTI، ومقياس كبير الحجم لكشف المركبات ثلاثية الأبعاد. في كلتا قاعدة البيانات، نظهر أن الكاشف المقترح يتفوق بشكل ملحوظ على الطرق الرائدة الأخرى فيما يتعلق بدقة الوسط (Average Precision - AP)، مع استمرار تشغيله بسرعة تزيد عن 28 إطارًا في الثانية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp