HyperAIHyperAI

Command Palette

Search for a command to run...

BEV-LaneDet: خط أساس بسيط وفعال للكشف عن المسارات ثلاثية الأبعاد

Ruihao Wang Jian Qin Kaiying Li Yaochen Li Dong Cao Jintao Xu

الملخص

الكشف عن المسارات ثلاثية الأبعاد، والذي يلعب دورًا حاسمًا في توجيه المركبات، أصبح موضوعًا قيد التطوير السريع في مجال القيادة الذاتية مؤخرًا. كانت الأعمال السابقة تعاني من صعوبات عملية بسبب التحويلات الفضائية المعقدة والتمثيلات غير المرنة للمسارات ثلاثية الأبعاد. وفي مواجهة هذه المشكلات، تقترح عملنا حلاً فعالًا وقويًا للكشف عن المسارات ثلاثية الأبعاد باستخدام الكاميرا أحادية العدسة يُعرف بـ BEV-LaneDet، مع ثلاثة إسهامات رئيسية. أولاً، نقدم الكاميرا الافتراضية التي توحّد المعلمات الداخلية والخارجية للكاميرات المثبتة على مركبات مختلفة لضمان ثبات العلاقة الفضائية بين الكاميرات. يمكن لهذه الكاميرا أن تعزز بشكل فعال عملية التعلم بفضل الفضاء البصري الموحد. ثانيًا، نقترح تمثيلًا بسيطًا ولكنه فعال للمسارات ثلاثية الأبعاد يُسمى تمثيل النقاط الرئيسية (Key-Points Representation). يعتبر هذا الوحدة أكثر ملاءمة لتمثيل الهياكل المعقدة والمتنوعة للمسارات ثلاثية الأبعاد. وأخيرًا، نقدم وحدة تحويل فضائي خفيفة الوزن ومناسبة للشرائح الإلكترونية تُسمى هرم التحويل الفضائي (Spatial Transformation Pyramid) لتحويل الخصائص الأمامية متعددة المقاييس إلى خصائص عرض الطائرة (BEV).تظهر النتائج التجريبية أن عملنا يتفوق على أفضل الأساليب الحالية من حيث F-Score، حيث يكون أعلى بنسبة 10.6٪ على مجموعة بيانات OpenLane وأعلى بنسبة 5.9٪ على مجموعة بيانات Apollo 3D الصناعية، بمعدل سرعة يصل إلى 185 إطار في الثانية. سيتم إطلاق الشيفرة المصدر على الرابط: https://github.com/gigo-team/bev_lane_det.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp