HyperAIHyperAI
منذ 2 أشهر

BEV-LaneDet: خط أساس بسيط وفعال للكشف عن المسارات ثلاثية الأبعاد

Wang, Ruihao ; Qin, Jian ; Li, Kaiying ; Li, Yaochen ; Cao, Dong ; Xu, Jintao
BEV-LaneDet: خط أساس بسيط وفعال للكشف عن المسارات ثلاثية الأبعاد
الملخص

الكشف عن المسارات ثلاثية الأبعاد، والذي يلعب دورًا حاسمًا في توجيه المركبات، أصبح موضوعًا قيد التطوير السريع في مجال القيادة الذاتية مؤخرًا. كانت الأعمال السابقة تعاني من صعوبات عملية بسبب التحويلات الفضائية المعقدة والتمثيلات غير المرنة للمسارات ثلاثية الأبعاد. وفي مواجهة هذه المشكلات، تقترح عملنا حلاً فعالًا وقويًا للكشف عن المسارات ثلاثية الأبعاد باستخدام الكاميرا أحادية العدسة يُعرف بـ BEV-LaneDet، مع ثلاثة إسهامات رئيسية. أولاً، نقدم الكاميرا الافتراضية التي توحّد المعلمات الداخلية والخارجية للكاميرات المثبتة على مركبات مختلفة لضمان ثبات العلاقة الفضائية بين الكاميرات. يمكن لهذه الكاميرا أن تعزز بشكل فعال عملية التعلم بفضل الفضاء البصري الموحد. ثانيًا، نقترح تمثيلًا بسيطًا ولكنه فعال للمسارات ثلاثية الأبعاد يُسمى تمثيل النقاط الرئيسية (Key-Points Representation). يعتبر هذا الوحدة أكثر ملاءمة لتمثيل الهياكل المعقدة والمتنوعة للمسارات ثلاثية الأبعاد. وأخيرًا، نقدم وحدة تحويل فضائي خفيفة الوزن ومناسبة للشرائح الإلكترونية تُسمى هرم التحويل الفضائي (Spatial Transformation Pyramid) لتحويل الخصائص الأمامية متعددة المقاييس إلى خصائص عرض الطائرة (BEV).تظهر النتائج التجريبية أن عملنا يتفوق على أفضل الأساليب الحالية من حيث F-Score، حيث يكون أعلى بنسبة 10.6٪ على مجموعة بيانات OpenLane وأعلى بنسبة 5.9٪ على مجموعة بيانات Apollo 3D الصناعية، بمعدل سرعة يصل إلى 185 إطار في الثانية. سيتم إطلاق الشيفرة المصدر على الرابط: https://github.com/gigo-team/bev_lane_det.

BEV-LaneDet: خط أساس بسيط وفعال للكشف عن المسارات ثلاثية الأبعاد | أحدث الأوراق البحثية | HyperAI