انظر مرتين قبل من القيادة: نحو محولات قابلة للتوسع للقيادة الذاتية من النهاية إلى النهاية

قد حققت القيادة الذاتية من النهاية إلى النهاية تقدمًا ملحوظًا في السنوات الأخيرة. غالبًا ما تتبنى الأساليب الحالية نموذج الفك والترميز، حيث يقوم جزء الترميز باستخراج الخصائص المخفية من بيانات المستشعرات الخام، بينما يقوم جزء الفك بإنتاج المسارات أو الأفعال المستقبلية للمركبة الرئيسية. وفقًا لهذا النموذج، لا يتوفر لجزء الترميز الوصول إلى السلوك المقصود للوكلة الرئيسية، مما يترك عبء تحديد المناطق الحرجة من حيث السلامة من المجال الواسع للمستقبل وكشف المعلومات حول المواقف المستقبلية لجزء الفك. وحتى أسوأ من ذلك، يتكون جزء الفك عادةً من عدة شبكات عصبية متعددة الطبقات بسيطة (MLP) أو وحدات الاسترجاع التكرارية (GRUs)، بينما يتم تصميم جزء الترميز بدقة عالية (مثل مزيج من شبكات ResNets الثقيلة أو الشبكة العصبية المتحولة Transformer). يؤدي هذا التقسيم غير المتوازن للموارد والأعمال إلى إعاقة عملية التعلم.في هذا العمل، نهدف إلى تخفيف المشكلة المذكورة أعلاه بمبدأين: (1) استغلال القدرة الكاملة لجزء الترميز؛ (2) زيادة قدرة جزء الفك. بشكل ملموس، نقوم أولًا بتوقع موقع وفعل مستقبليين خشنين بناءً على خصائص جزء الترميز. ثم، بشرط الموقع والفعل، يتم تخيل المشهد المستقبلي للتحقق من الآثار إذا قمنا بالقيادة حسب ذلك. كما نستعيد خصائص جزء الترميز حول الإحداثي المتوقع للحصول على معلومات دقيقة عن المنطقة الحرجة من حيث السلامة. وأخيرًا، بناءً على الموقع والفعل المستقبليين المتوقعين وخواص السمة البارزة المستعادة، نقوم بتحسين الموقع والفعل الخشنين بتوقع الانحراف عنهما بالنسبة للحالة الحقيقية. يمكن ترتيب وحدة التحسين المذكورة أعلاه بطريقة متتابعة، مما يزيد من قدرة جزء الفك باستخدام المعرفة السابقة الزمانية والمكانية عن المستقبل المشروط. نجري التجارب على المحاكي CARLA ونحقق أفضل الأداء في مقاييس الحلقة المغلقة. تظهر دراسات الاختزال الواسعة فعالية كل وحدة مقترحة.