التعلم العميق لاكتشاف وتعرف العلامات المرورية على نطاق واسع

الكشف والتمييز التلقائي للشارات المرورية يلعب دورًا حاسمًا في إدارة مخزون الشارات المرورية. فهو يوفر طريقة دقيقة وفورية لإدارة هذا المخزون مع بذل جهد بشري قليل نسبيًا. وفي مجتمع رؤية الحاسوب، يعد الكشف والتمييز بين الشارات المرورية مشكلة تم دراستها بشكل كبير. ومعظم النهج الموجودة تؤدي بشكل جيد بالنسبة للشارات المرورية اللازمة لأنظمة المساعدة المتقدمة للسائقين وأنظمة القيادة الذاتية. ومع ذلك، فإن هذا يمثل عددًا نسبيًا صغيرًا من جميع الشارات المرورية (حوالي 50 فئة من عدة مئات)، وأداء النهج على باقي مجموعة الشارات المرورية، والتي تُستخدم لحذف العمل اليدوي في إدارة مخزون الشارات المرورية، لا يزال سؤالًا مفتوحًا.في هذه الورقة البحثية، نتناول مشكلة الكشف والتمييز بين عدد كبير من فئات الشارات المرورية التي تناسب تطبيق الأتمتة في إدارة مخزون الشارات المرورية. نعتمد على نهج شبكات العصبانية التلافيفية (CNN)، وهو نموذج Mask R-CNN، لمعالجة خط الأنابيب الكامل للكشف والتمييز مع التعلم التلقائي من البداية إلى النهاية. نقترح العديد من التحسينات التي يتم تقييمها في الكشف عن الشارات المرورية وتؤدي إلى تحسين الأداء الإجمالي. يتم تطبيق هذا النهج على كشف 200 فئة من الشارات المرورية الممثلة في مجموعة بيانات جديدة ابتكرناها.نقدم النتائج حول فئات شارات مرورية ذات تحديات عالية لم يتم النظر فيها بعد في الأعمال السابقة. كما نقدم تحليلًا شاملًا للطريقة المستندة إلى التعلم العميق للكشف عن الشارات المرورية ذات الاختلاف الكبير في المظهر داخل الفئة الواحدة ونوضح أن معدل الأخطاء أقل من 3% باستخدام النهج المقترح، وهو ما يعتبر كافيًا لتطبيقه في الاستخدامات العملية لإدارة مخزون الشارات المرورية.