تمثيل الوجه بالتعلم العميق من خلال التنبؤ بـ 10,000 فئة

تُقترح في هذه الورقة تعلم مجموعة من تمثيلات الميزات عالية المستوى من خلال التعلم العميق، والمعروفة بـ"ميزات الهوية العميقة" (DeepID)، لغرض التحقق من الهوية الوجهية. ونُجادل بأن ميزات DeepID يمكن تعلّمها بشكل فعّال من خلال مهام التعرف على الوجه متعددة الفئات الصعبة، مع إمكانية تعميمها على مهام أخرى (مثل التحقق من الهوية) والهويات الجديدة التي لم تُرَ في مجموعة التدريب. علاوةً على ذلك، تزداد قدرة تعميم ميزات DeepID كلما زاد عدد فئات الوجه التي يتم التنبؤ بها أثناء التدريب. تُستخلص ميزات DeepID من تنشيطات العقد في الطبقة المخفية الأخيرة للشبكات العصبية التلافيفية العميقة (ConvNets). عند تعلّم هذه الشبكات كفئات لتمييز حوالي 10,000 هوية وجهية في مجموعة التدريب، وبتهيئة لخفض عدد العقد تدريجيًا على طول هرمية استخلاص الميزات، تتشكل تدريجيًا ميزات مكثفة مرتبطة بالهوية في الطبقات العليا، باستخدام عدد صغير جدًا من العقد المخفية. وتُستخلص الميزات المقترحة من مناطق مختلفة من الوجه لتكوين تمثيلات مكملة ومتعددة (Over-complete). ويمكن تعلّم أي فئة من الفئات المتطورة حديثًا بناءً على هذه التمثيلات عالية المستوى لغرض التحقق من الهوية الوجهية. وقد تم تحقيق دقة تحقق بلغت 97.45% على مجموعة LFW باستخدام وجوه غير متماثلة بشكل قوي.