نهج واقعي لإنشاء وجوه مغطاة تم تطبيقه على مجموعتي بيانات جديدتين للتعريف بالوجوه المغطاة

تُثير جائحة كوفيد-19 مشكلة تكييف أنظمة التعرف على الوجه مع الواقع الجديد، حيث قد يرتدي الأشخاص أقنعة جراحية لتغطية أنفهم وأفواههم. كانت المجموعات البيانات التقليدية المستخدمة في تدريب هذه الأنظمة (مثل CelebA وCASIA-WebFace) قد أُطلقت قبل الجائحة، وبالتالي تبدو غير مناسبة الآن نظرًا لغياب أمثلة عن أشخاص يرتدون أقنعة. نقترح طريقة لتحسين مجموعات البيانات التي تحتوي على وجوه دون أقنعة من خلال إنشاء أقنعة اصطناعية وتطبيقها على الوجوه في الصور الأصلية. تعتمد طريقتنا على برنامج SparkAR Studio، الذي طورته فيسبوك لتطوير مرشحات الوجه لإنستغرام. في نهجنا، نستخدم 9 أقنعة مختلفة من حيث الألوان والأحجام والمواد. ونستخدم هذه الطريقة لإنشاء عدد يبلغ 445,446 عينة (90٪) من الأقنعة لمجموعة بيانات CASIA-WebFace، و196,254 عينة (96.8٪) من الأقنعة لمجموعة بيانات CelebA، مع إتاحة صور الأقنعة للعامة عبر الرابط: https://github.com/securifai/masked_faces. ونُظهر أن طريقتنا تُنتج أمثلة تدريب أكثر واقعية بكثير من الأقنعة المُطبقة على الوجوه، وذلك من خلال طلب متطوعين مقارنة نوعية بينها وبين طرق أو مجموعات بيانات أخرى مُصممة لهذا الغرض. كما نُثبت فائدة طريقتنا من خلال تقييم أنظمة التعرف على الوجه من الطراز المُتقدم (FaceNet وVGG-face وArcFace) التي تم تدريبها على مجموعات البيانات المُحسَّنة باستخدام طريقتنا، ونُظهر أن هذه الأنظمة تتفوّق على الأنظمة المماثلة التي تم تدريبها على مجموعات بيانات أصلية (تحتوي على وجوه دون أقنعة) أو على مجموعات بيانات منافسة (تحتوي على أقنعة تم إنشاؤها باستخدام طرق ذات صلة)، عند اختبارها باستخدام معايير تقييم تحتوي على وجوه مغطاة بأقنعة.