TopoBDA: نحو انتباه قابل للتشويه بيزيه لفهم هيكل الطرق

فهم البنية التحتية للطرق أمر بالغ الأهمية للقيادة الذاتية. يقدّم هذا البحث منهجًا جديدًا يُسمّى TopoBDA (البنية التحتية مع الانتباه القابل للتشويه باستخدام منحنيات بيزيه)، الذي يعزز فهم البنية التحتية للطرق من خلال الاستفادة من آلية الانتباه القابلة للتشويه باستخدام منحنيات بيزيه (BDA). يقوم TopoBDA بمعالجة صور متعددة الكاميرات بزاوية 360 درجة لاستخلاص ميزات من منظور البصرة (Bird's Eye View (BEV))، والتي تُحسّن عبر معالج تحويلي (transformer decoder) يستخدم آلية BDA. تعتمد BDA على نقاط تحكم بيزيه لتشغيل آلية الانتباه القابلة للتشويه، مما يُحسّن كشف وتمثيل الهياكل الخطية الطويلة والرفيعة، مثل خطوط وسط المسارات. علاوةً على ذلك، يدمج TopoBDA مكونين مساعدين: خسارة تشكيل قناع الفئة (instance mask formulation loss) واستراتيجية توقع متعددة إلى واحدة (one-to-many set prediction loss)، لتحسين إجراءات كشف خطوط الوسط وتعزيز الفهم العام للبنية التحتية للطرق. أظهرت التقييمات التجريبية على مجموعة بيانات OpenLane-V2 أن TopoBDA يتفوّق على الطرق الحالية، ويحقق نتائج رائدة في مجال كشف خطوط الوسط واستنتاج البنية التحتية. كما حقق TopoBDA أفضل النتائج على مجموعة بيانات OpenLane-V1 في مجال كشف المسارات ثلاثية الأبعاد. أظهرت تجارب إضافية حول دمج البيانات متعددة الوسائط – مثل LiDAR، والرادار، وSDMap – أن الدخل المتعدد الوسائط يمكن أن يُعزز الأداء بشكل أكبر في فهم البنية التحتية للطرق.