HyperAIHyperAI
منذ 2 أشهر

PIXOR: الكشف عن الأشياء ثلاثية الأبعاد في الوقت الفعلي من السحابات النقطية

Yang, Bin ; Luo, Wenjie ; Urtasun, Raquel
PIXOR: الكشف عن الأشياء ثلاثية الأبعاد في الوقت الفعلي من السحابات النقطية
الملخص

نعالج مشكلة الكشف عن الأشياء ثلاثية الأبعاد في الوقت الحقيقي من السحب النقطية في سياق القيادة الذاتية. تعتبر سرعة الحساب أمرًا حاسمًا حيث أن الكشف هو مكون ضروري للأمان. ومع ذلك، فإن الأساليب الحالية تكون باهظة التكلفة من حيث الحساب بسبب البعد العالي للسحب النقطية. نستخدم البيانات ثلاثية الأبعاد بشكل أكثر كفاءة من خلال تمثيل المشهد من وجهة النظر الطائر (Bird's Eye View - BEV)، ونقترح PIXOR، وهو كاشف بدون اقتراحات ومرحلة واحدة ينتج تقديرات للأجسام ثلاثية الأبعاد الموجهة التي يتم تفكيكها من التنبؤات العصبية على مستوى البكسل. تم تصميم تمثيل الإدخال، هندسة الشبكة، وتحسين النموذج خصيصًا لموازنة الدقة العالية وكفاءة الوقت الحقيقي. نتحقق من صحة PIXOR على قاعدتين بيانات: معيار كشف الأجسام من وجهة النظر الطائر (BEV) في KITTI، ومقياس كبير الحجم لكشف المركبات ثلاثية الأبعاد. في كلتا قاعدة البيانات، نظهر أن الكاشف المقترح يتفوق بشكل ملحوظ على الطرق الرائدة الأخرى فيما يتعلق بدقة الوسط (Average Precision - AP)، مع استمرار تشغيله بسرعة تزيد عن 28 إطارًا في الثانية.