FairFace: مجموعة بيانات خصائص الوجه المتوازنة من حيث العرق والجنس والعمر

القواعد البيانات العامة الحالية للوجوه متحيزة بشدة نحو الوجوه البيضاء، وتمثيل الأعراق الأخرى (مثل اللاتينية) ضعيف بشكل كبير. يمكن أن يؤدي هذا إلى عدم اتساق دقة النماذج، ويحد من قابلية تطبيق أنظمة تحليل الوجه على مجموعات الأعراق غير البيضاء، ويؤثر سلباً على نتائج البحث المستندة إلى مثل هذه البيانات المائلة. لmitigating هذا التحيز العرقي في هذه القواعد البيانات، قمنا ببناء قاعدة بيانات صور وجوه جديدة تحتوي على 108,501 صورة مع التركيز على التوازن في تركيب الأعراق في القاعدة البيانات. حددنا 7 مجموعات عرقية: بيض، سود، هنود، شرق آسيويون، جنوب شرق آسيويون، الشرق الأوسطيون، ولاتينيون. تم جمع الصور من مجموعة بيانات YFCC-100M Flickr وتصنيفها حسب العرق والجنس والفئة العمرية. أجريت التقييمات على قواعد بيانات صفات الوجه الموجودة وكذلك على قواعد بيانات الصور الجديدة لقياس أداء التعميم. وجدنا أن النموذج الذي تم تدريبه باستخدام قاعدة بياناتنا يتمتع بدقة أعلى بكثير على قواعد البيانات الجديدة وأن الدقة متسقة بين مجموعات العرق والجنس.请注意,"mitigating" 在阿拉伯语中被翻译为 "تخفيف" 或 "التقليل من"،以保持句子的流畅性和正式性。以下是修正后的版本:القواعد البيانات العامة الحالية للوجوه متحيزة بشدة نحو الوجوه البيضاء، وتمثيل الأعراق الأخرى (مثل اللاتينية) ضعيف بشكل كبير. يمكن أن يؤدي هذا إلى عدم اتساق دقة النماذج، ويحد من قابلية تطبيق أنظمة تحليل الوجه على مجموعات الأعراق غير البيضاء، ويؤثر سلباً على نتائج البحث المستندة إلى مثل هذه البيانات المائلة. للتخفيف من هذا التحيز العرقي في هذه القواعد البيانات، قمنا ببناء قاعدة بيانات صور وجوه جديدة تحتوي على 108,501 صورة مع التركيز على التوازن في تركيب الأعراق في القاعدة البيانات. حددنا 7 مجموعات عرقية: بيض، سود، هنود، شرق آسيويون، جنوب شرق آسيويون، الشرق الأوسطيون، ولاتينيون. تم جمع الصور من مجموعة بيانات YFCC-100M Flickr وتصنيفها حسب العرق والجنس والفئة العمرية. أجريت التقييمات على قواعد بيانات صفات الوجه الموجودة وكذلك على قواعد بيانات الصور الجديدة لقياس أداء التعميم. وجدنا أن النموذج الذي تم تدريبه باستخدام قاعدة بياناتنا يتمتع بدقة أعلى بكثير على قواعد البيانات الجديدة وأن الدقة متسقة بين مجموعات العرق والجنس.