HyperAIHyperAI
منذ 2 أشهر

Bench2Drive: نحو تقييم متعدد القدرات للقيادة الذاتية المغلقة الدائرة من النهاية إلى النهاية

Jia, Xiaosong ; Yang, Zhenjie ; Li, Qifeng ; Zhang, Zhiyuan ; Yan, Junchi
Bench2Drive: نحو تقييم متعدد القدرات للقيادة الذاتية المغلقة الدائرة من النهاية إلى النهاية
الملخص

في عصر يُميزه التوسع السريع في نماذج الأساس، تقترب تقنيات القيادة الذاتية من نقطة تحولية حيث تظهر القيادة الذاتية من النهاية إلى النهاية (E2E-AD) بفضل إمكاناتها في التوسع بطريقة تعتمد على البيانات. ومع ذلك، يتم تقييم معظم طرق E2E-AD الحالية تحت بروتوكول إعادة تشغيل السجلات المفتوحة مع أخطاء L2 ومعدل الاصطدام كمقياس (مثل في nuScenes)، مما لا يمكن أن يعكس بشكل كامل أداء الخوارزميات كما اعترفت به المجتمع مؤخرًا. بالنسبة للطرق التي يتم تقييمها تحت البروتوكول المغلق، فإنها تخضع لاختبارات في مسارات ثابتة (مثل Town05Long و Longest6 في CARLA) باستخدام درجة القيادة كمقياس، والتي تتميز بتفاوت كبير بسبب عدم استقرار دالة المقياس والصدفة الكبيرة في المسار الطويل. بالإضافة إلى ذلك، غالبًا ما تقوم هذه الطرق بتجميع بيانات خاصة بها للتدريب، مما يجعل المقارنة العادلة بين الخوارزميات غير ممكنة.لإشباع الحاجة الملحة لبيئات اختبار شاملة وواقعية وعدالة لتقنيات Full Self-Driving (FSD)، نقدم Bench2Drive، أول مقاييس لتقييم قدرات أنظمة E2E-AD المتعددة بطريقة مغلقة. تتكون بيانات التدريب الرسمية لـ Bench2Drive من 2 مليون إطار مُشروح بالكامل، تم جمعها من 13638 مقطع قصير موزعة بشكل متساوٍ تحت 44 سيناريو تفاعليًا (التدخل، التجاوز، الانحراف، إلخ)، 23 حالة جوية (مشمسة، ضبابية، ماطرة، إلخ)، و12 مدينة (حضرية، قرية، جامعة، إلخ) في CARLA الإصدار الثاني. يتطلب بروتوكول التقييم الخاص بها أن تمر نماذج E2E-AD بـ 44 سيناريو تفاعليًا في مواقع وجواً مختلفًا يصل عددها إلى 220 مسارًا، مما يوفر تقييمًا شاملًا ومنفصلًا لقدرات القيادة الخاصة بها في ظروف مختلفة. قدمنا تنفيذًا لأحدث نماذج E2E-AD وتقيمنا لها في Bench2Drive، مما يوفر رؤى حول الحالة الحالية والاتجاهات المستقبلية.

Bench2Drive: نحو تقييم متعدد القدرات للقيادة الذاتية المغلقة الدائرة من النهاية إلى النهاية | أحدث الأوراق البحثية | HyperAI