الاستدلال الطوبوغرافي القائم على الرسوم البيانية للمواقف القيادة

فهم جينوم الطريق أمر ضروري لتحقيق القيادة الذاتية. هذه المشكلة ذات الذكاء العالي تتضمن جوانبَين - علاقة الاتصال بين المسارات، وعلاقة التخصيص بين المسارات وعناصر المرور، حيث يفتقر الطريقة الشاملة للاستدلال بالطوبولوجيا. من ناحيةٍ أولى، تجدّد تقنيات تعلم الخرائط السابقة في استنتاج اتصال المسارات باستخدام نماذج التقسيم أو خطوط المسارات؛ أو أن النهج الموجه نحو طوبولوجيا المسار السابق يركز على الكشف عن الخطوط الوسطية ويغفل نمذجة التفاعل. ومن ناحيةٍ أخرى، فإن مشكلة تخصيص عناصر المرور إلى المسارات محدودة في مجال الصورة، مما يجعل كيفية بناء التقابل من وجهتي النظر تحديًا غير مستكشف. لمعالجة هذه القضايا، نقدم TopoNet (توبونت)، الإطار الأول من نوعه قادر على تجريد المعرفة المرورية خارج المهام الإدراكية التقليدية. لتقاطع طوبولوجيا المشهد القياسي، نقدم ثلاثة تصاميم رئيسية: (1) وحدة تمثيل لتضمين المعرفة الدلالية من العناصر ثنائية الأبعاد في فضاء ميزات موحد؛ (2) شبكة عصبية للمشهد تم تصميمها بعناية لنمذجة العلاقات وتوفير التفاعل بين الميزات داخل الشبكة؛ (3) بدلاً من نقل الرسائل بشكل تعسفي، تم وضع رسم بياني لمعرفة المشهد لتمييز المعرفة السابقة عن أنواع مختلفة من جينوم الطريق. قمنا بتقييم TopoNet (توبونت) على مقاييس الفهم الصعبة للمشهد OpenLane-V2 (أوبنلاين-ف2)، حيث أثبتت طريقتنا تفوقها بكثير على جميع الأعمال السابقة في جميع المقاييس الإدراكية والطوبولوجية. تم إصدار الكود فيhttps://github.com/OpenDriveLab/TopoNet