PyramidBox: كاشف الوجوه بمساعدة السياق في تصويب واحد

تم دراسة اكتشاف الوجه لسنوات عديدة، وأحد التحديات المتبقية هو اكتشاف الوجوه الصغيرة والمشوهة جزئياً في بيئات غير مراقبة. يقترح هذا البحث مكتشفاً للوجوه بطلقة واحدة مساعداً بالسياق، يُطلق عليه اسم \emph{PyramidBox}، للتعامل مع مشكلة اكتشاف الوجه الصعبة. من خلال ملاحظة أهمية السياق، نحسن استخدام المعلومات السياقية في الجوانب الثلاثة التالية. أولاً، نصمم رابطاً سياقياً جديداً لمراقبة تعلم الخصائص السياقية العليا بطريقة شبه إشرافية، والتي نسميها PyramidAnchors (رابط الأهرامات). ثانياً، نقترح شبكة هرمية للميزات المستوى المنخفض لدمج الميزات السياقية الدلالية المناسبة للمستوى العالي وميزات الوجه المستوى المنخفض معًا، مما يسمح لـ PyramidBox بتوقع الوجوه بمختلف المقاييس في طلقة واحدة. ثالثاً، نقدم بنية حساسة للسياق لزيادة قدرة شبكة التنبؤ على تحسين دقة النتائج النهائية. بالإضافة إلى ذلك، نستخدم طريقة Data-anchor-sampling (عينة الرابط البيانات) لتضخيم العينات التدريبية عبر مقاييس مختلفة، مما يزيد من تنوع بيانات التدريب للوجوه الأصغر حجماً. من خلال استغلال قيمة السياق، حققت PyramidBox أداءً فائقاً بين أفضل التقنيات الحالية على منصتي الاختبار الشائعتين لاكتشاف الوجه FDDB و WIDER FACE. يمكن الحصول على كودنا في PaddlePaddle: \href{https://github.com/PaddlePaddle/models/tree/develop/fluid/face_detection}{\url{https://github.com/PaddlePaddle/models/tree/develop/fluid/face_detection}}.