HyperAIHyperAI
منذ 2 أشهر

MapTR: النمذجة والتعلم الهيكليان لبناء الخرائط عالية الدقة المتجهة عبر الإنترنت

Liao, Bencheng ; Chen, Shaoyu ; Wang, Xinggang ; Cheng, Tianheng ; Zhang, Qian ; Liu, Wenyu ; Huang, Chang
MapTR: النمذجة والتعلم الهيكليان لبناء الخرائط عالية الدقة المتجهة عبر الإنترنت
الملخص

الخريطة عالية الدقة (HD) تقدم معلومات بيئية وفيرة ودقيقة عن مشهد القيادة، وتُعد مكونًا أساسيًا وغير قابل للإغفال في التخطيط لنظام القيادة الذاتية. نقدم MapTR، وهي هيكلة لـ Transformer تعمل بكفاءة على بناء الخرائط المتجهة عالية الدقة بشكل مباشر عبر الإنترنت. نقترح نهجًا موحدًا للنمذجة المتكافئة التباديل، أي نمذجة عناصر الخريطة كمجموعة من النقاط مع مجموعة من التباديل المكافئة، مما يصف بدقة شكل عناصر الخريطة ويستقر عملية التعلم. نصمم مخطط تضمين استعلامات متدرج لترميز المعلومات الخريطية المنظمة بمرنٍ، وأداء التناظر الثنائي المتدرج لتعلم عناصر الخريطة. يحقق MapTR أفضل الأداء والكفاءة باستخدام إدخال الكاميرا فقط بين جميع النهج الحالية لبناء الخرائط المتجهة على مجموعة بيانات nuScenes. وبشكل خاص، يعمل MapTR-nano بسرعة استدلال في الوقت الفعلي (25.1 صورة في الثانية) على بطاقة الرسومات RTX 3090، وهو أسرع بمقدار 8 مرات من الطريقة الحالية الأكثر تقدمًا التي تعتمد على الكاميرا بينما يحقق دقة أعلى بمقدار 5.0 في المقياس المتوسط للمتوافقيات (mAP). وحتى عند المقارنة بالطرق المتعددة الوسائط الأكثر تقدمًا حاليًا، فإن MapTR-nano يحقق دقة أعلى بمقدار 0.7 في mAP، بينما يحقق MapTR-tiny دقة أعلى بمقدار 13.5 في mAP وسرعة استدلال أسرع بمقدار 3 مرات. تظهر النتائج النوعية الوافرة أن MapTR تحافظ على جودة بناء الخرائط المستقرة والموثوقة في مشاهد قيادة معقدة ومتنوعة. يعتبر MapTR ذو قيمة تطبيقية كبيرة في مجال القيادة الذاتية. يمكن الحصول على الشفرة البرمجية ومزيد من العروض التقديمية من الرابط \url{https://github.com/hustvl/MapTR}.