F2DNet: شبكة كشف بؤري سريع للكشف عن المشاة

تمثّل الكاشفات ذات المرحلتين الحدّ الأقصى من التقدّم في كاشفات الكائنات، وكذلك في كاشفات المشاة. ومع ذلك، فإن الكاشفات ذات المرحلتين الحالية غير فعّالة نظرًا لأنها تُجري تحسين المربعات المحيطة (bounding box regression) عبر خطوات متعددة، أي في شبكات اقتراح المناطق (region proposal networks) وفي رؤوس المربعات المحيطة (bounding box heads). كما أن شبكات اقتراح المناطق القائمة على المعايير (anchor-based) تتطلب تدريبًا مكلفًا من الناحية الحسابية. نُقدّم F2DNet، وهي معمارية كاشفة ثنائية المرحلة جديدة، تُزيل التكرار في الكاشفات ذات المرحلتين الحالية من خلال استبدال شبكة اقتراح المناطق بـ "شبكة الكشف المركزي" (focal detection network) التي نقترحها، وبدلاً من رأس المربع المحيط، نستخدم "رأس التثبيط السريع" (fast suppression head). قمنا باختبار F2DNet على أبرز مجموعات بيانات كشف المشاة، وقمنا بمقارنة مفصلة مع الكاشفات الرائدة الحالية، بالإضافة إلى إجراء تقييمات عبر مجموعات بيانات مختلفة لاختبار قدرة نموذجنا على التعميم على بيانات غير مرئية. حققت F2DNet تحسينات بنسبة 8.7٪ و2.2٪ و6.1٪ في معدّل الخطأ (MR-2) على مجموعات بيانات City Persons وCaltech Pedestrian وEuro City Persons على التوالي، عند تدريبها على مجموعة بيانات واحدة، وبلغت 20.4٪ و26.2٪ في حالة التداخل الشديد (heavy occlusion) على مجموعتي بيانات Caltech Pedestrian وCity Persons عند استخدام التحسين التدريجي (progressive fine-tuning). علاوة على ذلك، تُظهر F2DNet زمن استجابة أقل بشكل كبير مقارنة بالكاشفات الرائدة الحالية. سيتم توفير الشفرة والنماذج المدربة عبر الرابط: https://github.com/AbdulHannanKhan/F2DNet.