K-Lane: مجموعة بيانات ومسار تقييم ليدار لطرق المدن والطرق السريعة

كDetection الخطوط هو وظيفة حيوية للقيادة الذاتية. مع التطور الأخير في التعلم العميق، ونشر مجموعات بيانات وكاميرات للكشف عن الخطوط، تطورت شبكات الكشف عن الخطوط باستخدام الكاميرات (CLDNs) بشكل ملحوظ. لكن من ناحية أخرى، تعتمد CLDNs على صور الكاميرات التي غالبًا ما تكون مشوهة بالقرب من خط الاختفاء، وعرضة لظروف إضاءة ضعيفة. هذا يتناقض مع شبكات الكشف عن الخطوط باستخدام ليدار (LLDNs)، التي يمكنها استخراج الخطوط مباشرة في رؤية الطيور (BEV) لخطة الحركة، وتعمل بشكل موثوق تحت ظروف إضاءة متنوعة. ومع ذلك، لم تُدرَس LLDNs بشكل نشط، وذلك أساسًا بسبب غياب مجموعات بيانات ليدار كبيرة متاحة للجمهور. في هذا البحث، نقدم K-Lane (KAIST-Lane)، أول مجموعة بيانات عامة في العالم وكبرى مجموعات بيانات الطرق الحضرية والطرق السريعة للكشف عن الخطوط باستخدام ليدار. تحتوي K-Lane على أكثر من 15 ألف إطار، وتشمل تسميات تصل إلى ستة خطوط تحت ظروف مختلفة للطرق والمرور، مثل الطرق المُحجبة بمستويات مختلفة من الاحتجاز، والطرق في النهار والليل، والخطوط المتفرعة (الانصهار والانفصال) والخطوط المنحنية. كما نقدم شبكات أساسية نسميها شبكات الكشف عن الخطوط باستخدام ليدار تعتمد على مُقارن الميزات العالمية (LLDN-GFC). تعتمد LLDN-GFC على الخصائص المكانية للخطوط في السحابة النقطية، التي تكون نادرة، رفيعة، وتمتد على طول السطح الأرضي الكامل للسحابة النقطية. من خلال النتائج التجريبية، حققت LLDN-GFC أداءً متقدمًا في مستوى الصناعة بدرجة F1 تبلغ 82.1٪ على K-Lane. علاوة على ذلك، تُظهر LLDN-GFC أداءً قويًا تحت ظروف إضاءة متنوعة، وهو ما يختلف عن CLDNs، كما أنها موثوقة حتى في حالات الاحتجاز الشديد، على عكس LLDNs التي تعتمد على الشبكات العصبية التقليدية (CNN). يمكن الوصول إلى K-Lane، ورمز التدريب الخاص بـ LLDN-GFC، والنماذج المُدرَّبة مسبقًا، وحزم التطوير الكاملة التي تشمل أدوات التقييم والتصور والتوثيق من خلال الرابط التالي: https://github.com/kaist-avelab/k-lane.