MixFaceNets: شبكات التعرف على الوجه ذات الكفاءة العالية للغاية

في هذا البحث، نقدم مجموعة من النماذج ذات الكفاءة العالية والمردود الكبير لتحقق التحقق الدقيق من الوجه، والتي تسمى MixFaceNets ومستوحاة من النواة المختلطة للتحويلات العميقة (Mixed Depthwise Convolutional Kernels). أظهرت التقييمات التجريبية الواسعة على مجموعات البيانات Label Face in the Wild (LFW)، Age-DB، MegaFace، ومقاييس IARPA Janus Benchmarks IJB-B وIJB-C فعالية MixFaceNets في التطبيقات التي تتطلب تعقيدًا حسابيًا شديد الانخفاض. تحت نفس مستوى التعقيد الحسابي (< 500 مليون عملية عائمة FLOPs)، تتفوق نماذجنا MixFaceNets على MobileFaceNets في جميع مجموعات البيانات المُقيَّمة، حيث حققت دقة بنسبة 99.60% على LFW، ودقة بنسبة 97.05% على AgeDB-30، ومعدل تقدير صحيح (TAR) بنسبة 93.60% (عند معدل الخطأ الأولي FAR1e-6) على MegaFace، ومعدل تقدير صحيح (TAR) بنسبة 90.94% (عند FAR1e-4) على IJB-B، ومعدل تقدير صحيح (TAR) بنسبة 93.08% (عند FAR1e-4) على IJB-C. عند وجود تعقيد حسابي بين 500 مليون و1 مليار عملية عائمة FLOPs، حققت نماذجنا MixFaceNets نتائجًا مشابهة للنماذج المرتبة الأولى بينما استخدمت عددًا أقل بكثير من العمليات العائمة FLOPs وأقل تكلفة حسابية، مما يثبت القيمة العملية لنماذج MixFaceNets المقترحة لدينا. تم جعل جميع أكواد التدريب والنموذج المُدرَّب مسبقًا وسجلات التدريب متاحة على الرابط: https://github.com/fdbtrs/mixfacenets.