إضاءة المشاة من خلال الكشف والتقسيم المتزامنين

الكشف عن المشاة هو مشكلة حاسمة في رؤية الحاسوب ولها تأثير كبير على السلامة في القيادة الذاتية الحضرية. في هذا البحث، نستكشف كيفية استخدام التجزئة الدلالية لتعزيز دقة الكشف عن المشاة مع وجود تأثير قليل أو معدوم على كفاءة الشبكة. نقترح شبكة دمج التجزئة لتمكين الإشراف المشترك على التجزئة الدلالية والكشف عن المشاة. عند وضعها بشكل صحيح، يساعد الإشراف الإضافي في توجيه الخصائص في الطبقات المشتركة لتصبح أكثر تعقيدًا ومفيدة للجهاز المكتشف للمشاة في المراحل اللاحقة. باستخدام هذه الطريقة، نجد أن الصناديق المُشَرَّحَة بضعف تكون كافية لتحقيق مكاسب أداء كبيرة. نقدم تحليلًا عميقًا لتوضيح كيف يتم تشكيل الطبقات المشتركة بواسطة الإشراف التجزئي. وبذلك، نظهر أن الخرائط المميزة الناتجة تصبح أكثر معنى دلاليًا وأكثر متانة ضد الشكل والتغطية. بشكل عام، يحقق إطارنا المشترك للكشف والتجزئة مكاسب كبيرة على أفضل التقنيات الموجودة حتى الآن في مجموعة بيانات Pedestrian Caltech، ويحقق أداءً تنافسيًا على KITTI، ويعمل بمعدل أسرع ضعفين من الطرق التنافسية.