HyperAIHyperAI
منذ 2 أشهر

S$^3$FD: كاشف الوجوه ذو الإطلاق الواحد والمقياس الثابت

Shifeng Zhang; Xiangyu Zhu; Zhen Lei; Hailin Shi; Xiaobo Wang; Stan Z. Li
S$^3$FD: كاشف الوجوه ذو الإطلاق الواحد والمقياس الثابت
الملخص

يقدم هذا البحث نظامًا لكشف الوجوه في الوقت الفعلي، يُسمى "S$^3$FD" أو "نظام الكشف عن الوجوه ذو الإطلاق الواحد والمرونة الحجمية" (Single Shot Scale-invariant Face Detector)، والذي يتميز بأدائه المتفوق في كشف الوجوه بمختلف أحجامها باستخدام شبكة عصبية عميقة واحدة، خاصة بالنسبة للوجوه الصغيرة. تحديدًا، نحاول حل المشكلة الشائعة التي تتمثل في تدهور أداء الكاشفات القائمة على الأهداف بشكل كبير عند تصغير الأشياء. نسهم في الجوانب الثلاثة التالية: 1) اقتراح إطار عمل متكافئ الحجم للكشف عن الوجوه لمعالجة مختلف أحجام الوجوه بفعالية. نقوم بتوزيع الأهداف على نطاق واسع من الطبقات لضمان حصول جميع أحجام الوجوه على خصائص كافية للكشف عنها. بالإضافة إلى ذلك، نصمم أحجام الأهداف بناءً على المجال الاستقبالي الفعال ومبدأ النسبة المتساوية المقترح؛ 2) تحسين معدل استدعاء الوجوه الصغيرة من خلال استراتيجية مطابقة الأهداف تعويض الحجم؛ 3) تقليل معدل الإشارات الخاطئة للوجوه الصغيرة عبر استخدام تصنيف الخلفية الأقصى (max-out background label). نتيجة لذلك، يحقق طريقنا أداءً رائدًا في الكشف عن الوجوه على جميع مقاييس الكشف الشائعة، بما في ذلك مجموعات البيانات AFW و PASCAL face و FDDB و WIDER FACE، ويمكنه العمل بمعدل 36 صورة في الثانية على بطاقة الرسومات Nvidia Titan X (Pascal) لصور ذات دقة VGA.

S$^3$FD: كاشف الوجوه ذو الإطلاق الواحد والمقياس الثابت | أحدث الأوراق البحثية | HyperAI