HyperAIHyperAI
منذ 7 أيام

GenAD: قيادة ذاتية نهائية توليدية

Wenzhao Zheng, Ruiqi Song, Xianda Guo, Chenming Zhang, Long Chen
GenAD: قيادة ذاتية نهائية توليدية
الملخص

إنتاج نتائج التخطيط مباشرةً من الحساسات الخام كان حلًا مُتَمَنَّى منذ فترة طويلة في القيادة الذاتية، وقد جذب اهتمامًا متزايدًا مؤخرًا. تعتمد معظم الطرق الحالية للقيادة الذاتية النهائية (end-to-end) على تفكيك هذه المشكلة إلى ثلاث مهام: التعرف (perception)، وتوقع الحركة (motion prediction)، والتخطيط (planning). ومع ذلك، نحن نرى أن النموذج التدريجي التقليدي لا يزال غير قادر على نمذجة عملية تطور المرور بالكامل، مثل التفاعل المستقبلي بين المركبة المستهدفة (ego car) والمشاركين الآخرين في حركة المرور، وكذلك المعرفة الهيكلية المسبقة حول المسارات. في هذه الورقة، نستكشف نموذجًا جديدًا للقيادة الذاتية النهائية، حيث يكمن جوهره في توقع كيفية تطور المركبة المستهدفة والبيئة المحيطة بناءً على المشاهد السابقة. نقترح GenAD، وهي إطار توليدي (generative framework) يحوّل مسألة القيادة الذاتية إلى مشكلة نمذجة توليدية. نقترح معالجًا متمحورًا حول الكيانات (instance-centric scene tokenizer) يقوم أولاً بتحويل المشاهد المحيطة إلى رموز مُدَوَّرة مُستندة إلى الخريطة (map-aware instance tokens). ثم نستخدم مُشفِّرًا تلقائيًا متغيرًا (variational autoencoder) لتعلم توزيع المسارات المستقبلية في فضاء خطي هيكلي (structural latent space) بهدف نمذجة المعرفة الهيكلية المسبقة. كما نستخدم نموذجًا زمنيًا لالتقاط حركات الوكلاء (agents) والمركبة المستهدفة داخل هذا الفضاء الخطي، بهدف إنتاج مسارات مستقبلية أكثر فعالية. في النهاية، تقوم GenAD بتنفيذ التوقع الحركي والتخطيط في آنٍ واحد، من خلال أخذ عينات من التوزيعات في الفضاء الخطي الهيكلي المُتعلَّم، مع الاعتماد على النموذج الزمني المُتعلَّم لتوليد السيناريوهات المستقبلية. أظهرت التجارب الواسعة على معيار nuScenes الشهير أداءً متميزًا (state-of-the-art) في مهام القيادة الذاتية النهائية المتمحورة حول الرؤية، مع كفاءة عالية. الكود: https://github.com/wzzheng/GenAD.

GenAD: قيادة ذاتية نهائية توليدية | أحدث الأوراق البحثية | HyperAI