خسارة سوفتماكس المقيدة بـ L2 للتحقق التمييزي من الوجه

في السنوات الأخيرة، تحسنت أداء أنظمة التحقق من الوجه بشكل كبير باستخدام الشبكات العصبية التلافيفية العميقة (DCNNs). يتضمن مسار العمل النموذجي للتحقق من الوجه تدريب شبكة عميقة للتعرف على الموضوع باستخدام دالة الخسارة سوفتماكس (softmax)، واستخدام إخراج الطبقة السابقة الأخيرة كوصفاء الميزات، وإنتاج درجة تشابه جيب التمام (cosine similarity) عند تقديم زوج من صور الوجه. لا تقوم دالة الخسارة سوفتماكس بتحسين الميزات لزيادة درجة التشابه للأزواج الإيجابية وتقليلها للأزواج السلبية، مما يؤدي إلى فجوة في الأداء. في هذا البحث، نضيف قيدًا L2 للموصفات التي يُفرض عليها أن تكمن على فراغ كروي ذي نصف قطر ثابت. يمكن تنفيذ هذا الوحدة بسهولة باستخدام الإطارات البرمجية الحالية للتعلم العميق. نوضح أن دمج هذه الخطوة البسيطة في مسار التدريب يعزز بشكل كبير أداء التحقق من الوجه. تحديدًا، حققنا أفضل النتائج حتى الآن على مجموعة البيانات الصعبة IJB-A، حيث بلغ معدل القبول الصحيح 0.909 بمعدل القبول الخاطئ 0.0001 في بروتوكول التحقق من الوجه. بالإضافة إلى ذلك، حققنا أفضل الأداء حتى الآن على مجموعة بيانات LFW بدقة 99.78٪، وأداءً تنافسيًا على مجموعة بيانات YTF بدقة 96.08٪.