HyperAIHyperAI
منذ 2 أشهر

PersFormer: الكشف عن المسارات ثلاثية الأبعاد من خلال المحول المنظوري ومعيار OpenLane

Chen, Li ; Sima, Chonghao ; Li, Yang ; Zheng, Zehan ; Xu, Jiajie ; Geng, Xiangwei ; Li, Hongyang ; He, Conghui ; Shi, Jianping ; Qiao, Yu ; Yan, Junchi
PersFormer: الكشف عن المسارات ثلاثية الأبعاد من خلال المحول المنظوري ومعيار OpenLane
الملخص

تم اقتراح طرق حديثة للكشف عن المسارات ثلاثية الأبعاد لمعالجة مشكلة عدم دقة تخطيط المسارات في العديد من سيناريوهات القيادة الذاتية (مثل الصعود والنزول على التلال، الحفر، إلخ). واجهت الأعمال السابقة صعوبات في الحالات المعقدة بسبب تصاميمها البسيطة للتحويل المكاني بين الرؤية الأمامية والرؤية الطائرية (BEV) ونقص مجموعة بيانات واقعية. بهدف معالجة هذه المشكلات، نقدم PersFormer: كاشف مسارات ثلاثي الأبعاد أحادي العدسة يعتمد على نظام تحويل خصائص فضائي جديد قائم على تقنية Transformer. يقوم نموذجنا بتكوين خصائص الرؤية الطائرية من خلال التركيز على المناطق المحلية ذات الصلة في الرؤية الأمامية باستخدام معلمات الكاميرا كمرجع. يعتمد PersFormer على تصميم موحد للأهداف ثنائية وثلاثية الأبعاد ومهمة مساعدة لاكتشاف المسارات ثنائية وثلاثية الأبعاد بشكل متزامن، مما يعزز توافق الخصائص ويشارك في فوائد التعلم متعدد المهام. بالإضافة إلى ذلك، نطلق واحدة من أولى مجموعات البيانات الواقعية الضخمة للكشف عن المسارات ثلاثية الأبعاد: OpenLane، والتي تحتوي على شروح عالية الجودة وتعدد السيناريوهات. تحتوي OpenLane على 200,000 إطار، وأكثر من 880,000 مسار مستوي، و14 فئة للمسارات، بالإضافة إلى علامات المشاهد والشروح المرتبطة بالمسارات المغلقة داخل المسار لتشجيع تطوير أساليب الكشف عن المسارات والطرق ذات الصلة بالصناعة في مجال القيادة الذاتية. نظهر أن PersFormer يتفوق بشكل كبير على الخطوط الأساسية التنافسية في مهمة الكشف عن المسارات ثلاثية الأبعاد في مجموعة بياناتنا الجديدة OpenLane وكذلك في مجموعة بيانات Apollo 3D Lane Synthetic، وهو أيضاً يحقق نتائج مماثلة لأحدث الخوارزميات في المهمة ثنائية الأبعاد على OpenLane. يمكن الوصول إلى صفحة المشروع عبر الرابط https://github.com/OpenPerceptionX/PersFormer_3DLane ومجموعة البيانات OpenLane متاحة عبر الرابط https://github.com/OpenPerceptionX/OpenLane.