Command Palette
Search for a command to run...
GMF-Drive: تكامل ماما المُتَّسِق مع تمثيل BEV واعٍ للمساحة لقيادة ذاتية من النهاية إلى النهاية
GMF-Drive: تكامل ماما المُتَّسِق مع تمثيل BEV واعٍ للمساحة لقيادة ذاتية من النهاية إلى النهاية
Jian Wang Chaokang Jiang Haitao Xu
الملخص
تُعيد النماذج القائمة على الانتشار إعادة تعريف أحدث المستويات في القيادة الذاتية من الطرف إلى الطرف، إلا أن أداءها يزداد تدهورًا مع التزايد في الاعتماد على عمليات دمج تعتمد على المحولات (Transformers). وتواجه هذه الهياكل قيودًا جوهرية: حيث تؤدي التعقيد الحسابي التربيعي إلى تقييد استخدام السمات عالية الدقة، كما أن غياب المُعطيات المكانية السابقة يمنعها من نمذجة البنية الطبيعية لتمثيلات منظور العين البصرية (Bird's Eye View - BEV) بشكل فعّال. تقدّم هذه الورقة إطار عمل جديدًا يُسمى GMF-Drive (الدمج المُتحكم به بمُحول مامبا للقيادة)، والذي يتجاوز هذه التحديات من خلال Innovations منهجية مزدوجة. أولاً، نستبدل التمثيل القائم على التوزيع التكراري (Histogram-based) للبيانات الليدار المحدودة بالمعلومات، بتمثيل مُعزّز هندسيًا على شكل أعمدة (Pillar) يُشغّل مُحددات الشكل والخصائص الإحصائية، مع الحفاظ على التفاصيل الهندسية الثلاثية الأبعاد الحيوية. ثانيًا، نقترح معمارية جديدة للدمج التسلسلي المُتحكم به بمُحول مامبا (GM-Fusion)، والتي تُستبدل بها المحولات المكلفة بنموذج مكاني فعّال للغاية يعتمد على الحالة الفضائية (State-Space Model - SSM). ويستفيد نموذج BEV-SSM الأساسي لدينا من التسلسل الاتجاهي وآليات الدمج المتكيف لالتقاط الاعتمادات الطويلة المدى بتعقيد خطي، مع احترام صريح للخصائص المكانية الفريدة لمشهد القيادة. وتبين التجارب الواسعة على معيار NAVSIM الصعب أن GMF-Drive يحقق أداءً جديدًا على مستوى الحد الأقصى، ويتفوق بشكل ملحوظ على نموذج DiffusionDrive. كما تؤكد دراسات التحليل التفصيلي الشاملة فعالية كل مكون، مُبرِّزة أن النماذج المخصصة للمهام (Task-specific SSMs) يمكن أن تتفوّق على المحولات العامة في كل من الأداء والكفاءة في مجال القيادة الذاتية.