Command Palette
Search for a command to run...
PIXOR: الكشف عن الأشياء ثلاثية الأبعاد في الوقت الفعلي من السحابات النقطية
PIXOR: الكشف عن الأشياء ثلاثية الأبعاد في الوقت الفعلي من السحابات النقطية
Bin Yang Wenjie Luo Raquel Urtasun
الملخص
نعالج مشكلة الكشف عن الأشياء ثلاثية الأبعاد في الوقت الحقيقي من السحب النقطية في سياق القيادة الذاتية. تعتبر سرعة الحساب أمرًا حاسمًا حيث أن الكشف هو مكون ضروري للأمان. ومع ذلك، فإن الأساليب الحالية تكون باهظة التكلفة من حيث الحساب بسبب البعد العالي للسحب النقطية. نستخدم البيانات ثلاثية الأبعاد بشكل أكثر كفاءة من خلال تمثيل المشهد من وجهة النظر الطائر (Bird's Eye View - BEV)، ونقترح PIXOR، وهو كاشف بدون اقتراحات ومرحلة واحدة ينتج تقديرات للأجسام ثلاثية الأبعاد الموجهة التي يتم تفكيكها من التنبؤات العصبية على مستوى البكسل. تم تصميم تمثيل الإدخال، هندسة الشبكة، وتحسين النموذج خصيصًا لموازنة الدقة العالية وكفاءة الوقت الحقيقي. نتحقق من صحة PIXOR على قاعدتين بيانات: معيار كشف الأجسام من وجهة النظر الطائر (BEV) في KITTI، ومقياس كبير الحجم لكشف المركبات ثلاثية الأبعاد. في كلتا قاعدة البيانات، نظهر أن الكاشف المقترح يتفوق بشكل ملحوظ على الطرق الرائدة الأخرى فيما يتعلق بدقة الوسط (Average Precision - AP)، مع استمرار تشغيله بسرعة تزيد عن 28 إطارًا في الثانية.