DNN المدمجة: نهج دمج الشبكات العصبية العميقة للكشف السريع والموثوق عن المشاة

نقترح معمارية دمج شبكات عصبية عميقة للكشف السريع والموثوق عن المشاة. تسمح المعمارية المقترحة بمعالجة شبكات متعددة بالتوازي لتحقيق السرعة. يتم تدريب شبكة تلافيفية عميقة ذات طلقة واحدة ككشف أهداف لإنتاج جميع المرشحين المحتملين للمشاة بحجم وأحجام مختلفة ومغطاة جزئياً. تقوم هذه الشبكة بإخراج مجموعة واسعة من مرشحي المشاة لتغطية الغالبية العظمى من المشاة الحقيقيين، مع إدخال عدد كبير من الإيجابيات الخاطئة. بعد ذلك، يتم استخدام شبكات عصبية عميقة متعددة بالتوازي لتحسين هذه المرشحين للمشاة بشكل أكبر. نقدم طريقة دمج الشبكات تعتمد على الرفض اللين لدمج مقاييس اللين من جميع الشبكات معاً لإنتاج درجات الثقة النهائية. أداء طريقتنا أفضل من الطرق الحالية الأكثر تقدماً، خاصة عند الكشف عن المشاة الصغار الحجم والمغطاة جزئياً (occluded). بالإضافة إلى ذلك، نقترح طريقة لدمج شبكة التجزئة الدلالية البكسلية في معمارية دمج الشبكات كتعزيز لكشف المشاة. تتفوق هذه الطريقة على الأساليب الأكثر تقدماً في معظم البروتوكولات في مجموعة بيانات Caltech Pedestrian، مع تحقيق تحسينات كبيرة في عدة بروتوكولات. كما أنها أسرع من جميع الطرق الأخرى.