RetinaFace: التحديد الكثيف لوجه الإنسان في البيئة الطبيعية بمرحلة واحدة

رغم التقدم الكبير الذي تحقق في اكتشاف الوجوه بدون تحكم، فإن تحديد موقع الوجه بدقة وكفاءة في البيئات الحقيقية لا يزال تحديًا مفتوحًا. يقدم هذا البحث نظامًا قويًا للكشف عن الوجه في مرحلة واحدة يُسمى RetinaFace، والذي يقوم بتحديد موقع الوجه على مستوى البكسل لوجوه بأحجام مختلفة من خلال الاستفادة من التعلم متعدد المهام تحت إشراف إضافي وذاتي. وبشكل خاص، نقدم المساهمات في الجوانب الخمسة التالية: (1) قمنا بتصنيف خمس نقاط مرجعية للوجه يدويًا على مجموعة بيانات WIDER FACE ولاحظنا تحسنًا كبيرًا في اكتشاف الوجوه الصعبة بمساعدة هذا الإشراف الإضافي. (2) أضفنا فرع مشفر شبكة ذاتي الإشراف للمشاركة بالتوازي مع الفروع المشرف عليها بالفعل، بهدف التنبؤ بمعلومات الشكل ثلاثي الأبعاد للوجه على مستوى البكسل. (3) على مجموعة الاختبار الصعبة من WIDER FACE، حقق RetinaFace تفوقًا على أفضل النتائج الحالية بمقدار 1.1% (حيث بلغت الدقة الوسطى AP 91.4%). (4) على مجموعة اختبار IJB-C، مكن RetinaFace أفضل الأساليب الحالية (مثل ArcFace) من تحسين نتائجها في التحقق من الهوية الوجهية (حيث بلغ معدل TAR 89.59% عند FAR=1e-6). (5) باستخدام شبكات ظهر خفيفة الوزن، يمكن لـ RetinaFace العمل بشكل زمني حقيقي على نواة المعالج الواحدة لصورة بدقة VGA. تم جعل التصنيفات الإضافية والرمز البرمجي متاحين عبر الرابط التالي: https://github.com/deepinsight/insightface/tree/master/RetinaFace.