توجيه طالب قابل للتوجيه

نقترح إطارًا جديدًا لنقل المعرفة بهدف تعليم وكيل طالب حسّي-حركي قيادة السيارة بشكل فعال تحت إشراف وكيل معلم متميز. تميل الطرق الحالية لنقل المعرفة إلى الوكلاء الحسّي-الحركية إلى تحقيق سلوك قيادة غير مثالي من قبل الطالب، وهو ما نفترض أنه يعود إلى الاختلافات الجوهرية بين المدخلات، وقدرة النمذجة، وعمليات التحسين لدى الوكيلين. نطور مخططًا جديدًا لنقل المعرفة يمكنه معالجة هذه القيود وإغلاق الفجوة بين الوكيل الحسّي-الحركي ومعلمه المتميز. الرؤية الأساسية لدينا هي تصميم وكيل طالب يتعلم مواءمة خصائص المدخلات الخاصة به مع المساحة المرئية الشاملة (Bird's Eye View - BEV) لمعلمه. بهذه الطريقة، يمكن للطالب الاستفادة من الإشراف المباشر من قبل المعلم على تعلم التمثيل الداخلي. لتسهيل مهمة التعلم الحسّي-الحركي الصعبة، يتم تحسين نموذج الطالب عبر آلية توجيه بسرعة الطالب مع إشراف مساعد مختلف. بالإضافة إلى ذلك، نقترح وكيلًا متميزًا ذو قدرة عالية تم تعلمه بالتقليد يتفوق على الوكلاء المتميزة السابقة في CARLA ويضمن أن يتعلم الطالب السلوك الآمن للقيادة. يؤدي الوكيل الحسّي-الحركي المقترح لدينا إلى وكيل تقليد صور قوي في CARLA، مما يحسن على النماذج الحالية بنسبة تزيد عن 20.6% في درجة القيادة دون الحاجة إلى LiDAR أو مشاهد تاريخية أو مجموعة من النماذج أو تجميع البيانات حسب السياسة أو التعلم التعزيزي.