LDNet: نهج الكشف عن علامات الحارة من الطرف إلى الطرف باستخدام حساس رؤية ديناميكي

تُزوّد المركبات الحديثة بأنظمة مساعدة السائق المختلفة، بما في ذلك نظام الحفاظ التلقائي على المسار، الذي يمنع الانحرافات غير المقصودة عن المسار. تعتمد الطرق التقليدية للكشف عن المسارات على ميزات مصممة يدويًا أو مبنية على التعلم العميق، تليها تقنيات ما بعد المعالجة لاستخراج المسارات باستخدام كاميرات RGB القائمة على الإطارات. إلا أن استخدام كاميرات RGB القائمة على الإطارات في مهام الكشف عن المسارات عرضة للتغيرات في الإضاءة، وانعكاسات الشمس، والضباب الحركي، مما يحد من أداء طرق الكشف عن المسارات. ويعتبر دمج كاميرا الحدث (event camera) في مهام الكشف عن المسارات ضمن بنية إدراك القيادة الذاتية واحدة من أكثر الحلول واعدة للتغلب على التحديات التي تواجه كاميرات RGB القائمة على الإطارات. ويتمثل الإسهام الرئيسي في هذا العمل في تصميم نموذج للكشف عن علامات المسارات، والذي يستخدم مستشعر الرؤية الديناميكية (Dynamic Vision Sensor). ويستعرض هذا البحث تطبيقًا جديدًا للكشف عن علامات المسارات باستخدام كاميرا الحدث، من خلال تصميم مشغل ترميز تلافيفي (convolutional encoder) يتبعه مشغل فك ترميز موجه بالانتباه (attention-guided decoder). وتحافظ وحدة التجميع الهرمي المكاني المُتعدد الفجوات الكثيفة (Dense Atrous Spatial Pyramid Pooling - ASPP) على الدقة المكانية للسمات المشفرة. كما أن آلية الانتباه الجمعية (additive attention) في مشغل الفك الترميز يعزز الأداء بالنسبة للسمات المشفرة عالية الأبعاد، مما يُعزز دقة تحديد المسارات ويقلل من حجم الحسابات المطلوبة في مرحلة ما بعد المعالجة. وقد تم تقييم فعالية العمل المقترح باستخدام مجموعة بيانات DVS لاستخراج المسارات (DET). وأظهرت النتائج التجريبية تحسنًا ملحوظًا بنسبة 5.54% و5.03% في مقياس F1 بالنسبة لمهمتي الكشف عن علامات المسارات متعددة الفئات والثنائية الفئة على التوالي. علاوةً على ذلك، تفوقت نقاط التقييم حسب مقياس التقاطع على الاتحاد (IoU) للطريقة المقترحة على أفضل طريقة من طرق الحالة الحالية بنسبة 6.50% و9.37% في المهام متعددة الفئات والثنائية الفئة على التوالي.