VAD: تمثيل المشهد المتجهي لقيادة السيارات ذاتية القيادة بكفاءة

القيادة الذاتية تتطلب فهمًا شاملًا للبيئة المحيطة لتحقيق تخطيط مسار موثوق. تعتمد الدراسات السابقة على تمثيل مشهد كثيف الرASTER (مثل، احتلال الوكيل والخريطة الدلالية) لأداء التخطيط، وهو أمر يتطلب حسابات معقدة ويغفل المعلومات الهيكلية على مستوى الحالة. في هذا البحث، نقترح VAD، وهي نموذج متجهي من النهاية إلى النهاية للقيادة الذاتية، يُمثِّل المشهد الطرقي كتمثيل متجهي كامل. يتمتع النموذج المتجهي المقترح بفوائد كبيرة اثنين. من ناحية، يستخدم VAD الحركة المتجهية للوكيل والعناصر الخرائطية كقيود صريحة للتخطيط على مستوى الحالة، مما يحسن بشكل كبير سلامة التخطيط. ومن ناحية أخرى، يعمل VAD بشكل أسرع بكثير من طرق التخطيط السابقة من النهاية إلى النهاية عن طريق التخلص من التمثيل الكثيف الرASTER والخطوات ما بعد المعالجة المصممة يدويًا. حقق VAD أداءً متقدمًا في تخطيط المسار من النهاية إلى النهاية على مجموعة بيانات nuScenes، حيث تفوق بشكل كبير على أفضل طريقة سابقة. لقد خفضت نموذجنا الأساسي، VAD-Base، معدل الاصطدامات المتوسط بنسبة 29.0٪ وعملت بوتيرة أسرع بمقدار 2.5 مرة. بالإضافة إلى ذلك، قدمت نسخة خفيفة الوزن، VAD-Tiny، تحسينًا كبيرًا في سرعة الاستدلال (بما يصل إلى 9.3 مرة) مع تحقيق أداء تخطيط مماثل تقريبًا. نعتقد أن الأداء الممتاز وكفاءة VAD العالية هما عاملان حاسمان لتطبيق نظام القيادة الذاتية في العالم الحقيقي. يمكن الحصول على الكود والنماذج عبر الرابط: https://github.com/hustvl/VAD لتسهيل البحث المستقبلي.注释:- "rasterized" 翻译为 "الـrASTER" 是为了保留原术语,同时在括号中标注原文。- "agent occupancy" 翻译为 "احتلال الوكيل",这是指代理(如车辆或行人)在场景中的位置。- "semantic map" 翻译为 "الخريطة الدلالية",指的是带有语义信息的地图。- "VAD" 和其他专有名词直接保留了英文形式。