DeepVisage: جعل التعرف على الوجه بسيطًا ومع ذلك مع مهارات تعميم قوية

تُظهر طرق التعرف على الوجه (FR) أداءً ملحوظًا من خلال تبني أساليب التعلم المستندة إلى الشبكات العصبية المتلافهة (CNN). رغم أن الشبكات العصبية المتلافهة (CNNs) يتم تدريبها في الغالب بتحسين خسارة softmax، إلا أن الاتجاه الحديث يُبيّن تحسينًا في الدقة باستخدام استراتيجيات مختلفة، مثل التعلم المحدد لل مهمة باستخدام دوال خسارة مختلفة، التعديل الدقيق على مجموعة البيانات المستهدفة، التعلم القياسي ودمج الخصائص من شبكات عصبية متلافهة متعددة. يتطلب دمج هذه المهام جهودًا إضافية بوضوح. بالإضافة إلى ذلك، فإنه يقلل من الحافز لاكتشاف نماذج شبكة عصبية متلافهة فعالة للتعرف على الوجه يتم تدريبها فقط باستخدام مُعرِّفات الهوية. نركز على هذا الواقع ونقترح طريقة للتعرف على الوجه تعتمد على شبكة عصبية متلافهة واحدة وسهلة التدريب. يستفيد نموذج شبكتنا العصبية المتلافهة من إطار التعلم المتبقي. كما أنه يستخدم الخصائص المُعَمَّرة لحساب الخسارة. تُظهر تجاربنا الواسعة تعميمًا ممتازًا على مجموعات بيانات مختلفة. نحصل على نتائج تنافسية ومتطورة للغاية في مجموعات البيانات LFW، IJB-A، YouTube faces وCACD.