PointBeV: نهج مُنْتَقَى لتنبؤات BeV

انطلقت تمثيلات العرض الطائري (BeV) كمساحة مشتركة facto de- في تطبيقات القيادة، حيث توفر مساحة موحدة لدمج بيانات الحساسات وتدعم المهام النهائية المختلفة. ومع ذلك، فإن النماذج التقليدية تستخدم شبكات ذات دقة ثابتة ومدى ثابت، مما يجعلها تواجه عدم كفاءة حسابية بسبب التخصيص الموحد للموارد عبر جميع الخلايا. لمعالجة هذه المشكلة، نقترح PointBeV، وهو نموذج تصنيف BeV نادر جديد يعمل على خلايا BeV نادرة بدلاً من الشبكات الكثيفة. يوفر هذا النهج سيطرة دقيقة على استخدام الذاكرة، مما يمكّن من استخدام سياقات زمنية طويلة ويتيح التكيف مع المنصات ذات القيود الذاكرية. يستخدم PointBeV استراتيجية فعالة بمرحلتين للتدريب، مما يمكّن من التركيز على الحسابات في المناطق ذات الاهتمام. عند الاستدلال، يمكن استخدامه مع مختلف تنازلات الذاكرة والأداء ويعتبر قابلًا للتعديل بشكل مرنة لحالات الاستخدام الجديدة. حقق PointBeV نتائج رائدة في مجموعة بيانات nuScenes لتصنيف المركبات والمشاة والمسارات، مما يظهر أداءً متفوقًا في الإعدادات الثابتة والزمنية رغم أنه تم تدريبه فقط باستخدام إشارات نادرة. سنقوم بإصدار شفرتنا المصدر بالإضافة إلى وحدتين فعالتين جديدتين مستخدمتين في الهندسة المعمارية: استخراج السمات النادرة (Sparse Feature Pulling)، المصممة لاستخراج السمات بكفاءة من الصور إلى BeV، وانتباه الفراغ الجزئي (Submanifold Attention)، الذي يمكّن من النمذجة الزمنية الفعالة. يمكن الوصول إلى شفرتنا المصدر من الرابط https://github.com/valeoai/PointBeV.