3D-LaneNet: الكشف عن المسارات المتعددة ثلاثية الأبعاد من البداية إلى النهاية

نقدم شبكة تتنبأ مباشرة بتصميم المسارات ثلاثية الأبعاد في مشهد الطريق من صورة واحدة. يعتبر هذا العمل أول محاولة لمعالجة هذه المهمة باستخدام أجهزة الاستشعار على متن السيارة دون افتراض عرض ثابت للمسار أو الاعتماد على بيئات تم رسم خرائطها مسبقًا. يتضمن تصميم شبكتنا، 3D-LaneNet، مفهومين جديدين: التحويل المنظوري العكسي داخل الشبكة (IPM) وتمثيل المسار القائم على النقطة المرجعية (Anchor). يسهل التحويل المنظوري العكسي داخل الشبكة تدفق المعلومات ثنائي التمثيل في كل من الرؤية الصورية العادية والرؤية العلوية. يتيح تمثيل الإخراج القائم على النقطة المرجعية لكل عمود نهجنا المتكامل من البداية إلى النهاية، مما يحل محل الأساليب التقليدية مثل التجميع ورفض القيم الشاذة، ويحول تقدير المسار إلى مشكلة كشف الأشياء. بالإضافة إلى ذلك، يتعامل نهجنا بشكل صريح مع الحالات المعقدة مثل دمج المسارات وانقسامها. يتم عرض النتائج على قاعدتين جديدتين للبيانات ثلاثية الأبعاد للمسارات، إحداهما مصنعة والأخرى حقيقية. لمقارنة طرقنا مع الطرق الموجودة، نختبر نهجنا على مقعد الاختبار tuSimple لكشف المسارات بالصورة فقط، حيث حقق أداءً تنافسيًا مع أفضل ما هو موجود حاليًا في هذا المجال.