VGGFace2: مجموعة بيانات لتمييز الوجوه عبر الأوضاع والأعمار

في هذا البحث، نقدم مجموعة بيانات وجوه جديدة على نطاق كبير تُسمى VGGFace2. تحتوي هذه المجموعة على 3.31 مليون صورة لـ 9131 شخصًا، بمتوسط 362.6 صورة لكل شخص. تم تنزيل الصور من محرك بحث الصور جوجل وتتميز بتنوع كبير في الوضعية والسن والإضاءة والعرق والمهنة (مثل الممثلين والرياضيين والسياسيين). تم جمع المجموعة مع ثلاثة أهداف في الاعتبار: (i) أن يكون لديها عدد كبير من الهويات وكذلك عدد كبير من الصور لكل هوية؛ (ii) تغطية نطاق واسع من الوضعيات والأعمار والأعراق؛ و(iii) تقليل الضوضاء في التسميات. نصف كيف تم جمع المجموعة، وبشكل خاص مراحل التصفية الآلية واليدوية لضمان دقة عالية للصور الخاصة بكل هوية. لتقييم أداء التعرف على الوجه باستخدام المجموعة الجديدة، قمنا بتدريب شبكات عصبية تقنية التعلم العميق ResNet-50 (بوجود أو عدم وجود كتل Squeeze-and-Excitation) على VGGFace2 وعلى MS-Celeb-1M وعلى اتحادهما، وأظهرنا أن التدريب على VGGFace2 يؤدي إلى تحسين الأداء في التعرف على الوجه عبر الوضعيات والأعمار. أخيرًا، باستخدام النماذج التي تم تدريبها على هذه المجموعات، أظهرنا أفضل الأداء في جميع مقاييس التعرف على الوجه التي وضعها مشروع IARPA Janus، مثل IJB-A وIJB-B وIJB-C، متجاوزين الحالة السابقة لأفضل الأداء بمقدار كبير. إن مجموعات البيانات والنماذج متاحة للجمهور بشكل عام.