Command Palette
Search for a command to run...
تقدير الفئة العمرية والجنس في البيئة الطبيعية باستخدام بنية Deep RoR
تقدير الفئة العمرية والجنس في البيئة الطبيعية باستخدام بنية Deep RoR
الملخص
التنبؤ التلقائي بمجموعة الأعمار والجنس من صور الوجه المُستخرجة في ظروف غير مُحددة يُعد مهمة مهمة وصعبة في العديد من التطبيقات الواقعية. ومع ذلك، فإن الطرق التقليدية التي تعتمد على ميزات مُصممة يدويًا على مجموعات بيانات تُعرف بـ "في البرية" (in-the-wild) تُظهر نتائج غير مرضية بسبب عدم قدرتها على التعامل مع التباين الكبير في صور الوجه غير المُحددة. وتم تخفيف هذه الصعوبة إلى حد ما من خلال استخدام الشبكات العصبية التلافيفية (CNN) بفضل قدرتها القوية في تمثيل الميزات. في هذه الورقة، نقترح طريقة جديدة تعتمد على CNN لتقدير مجموعة الأعمار والجنس، باستخدام بنية "شبكة المقاومة من شبكات المقاومة" (Residual Networks of Residual Networks - RoR)، والتي تُظهر قدرة أفضل على التحسين في تصنيف مجموعة الأعمار والجنس مقارنة ببنية الشبكات العصبية التلافيفية الأخرى. علاوة على ذلك، نقدّم آلتين بسيطتين تستندان إلى ملاحظة خصائص مجموعات الأعمار، بهدف تحسين أداء التنبؤ بعمر الفرد بشكل أكبر. ولتحسين الأداء بشكل إضافي وتقليل مشكلة التفوق المفرط (over-fitting)، يتم تدريب نموذج RoR مسبقًا على مجموعة بيانات ImageNet، ثم يتم تدريبه بدقة (fine-tuning) على مجموعة بيانات IMDB-WIKI-101 لاستخلاص ميزات إضافية للصور الوجهية، وأخيرًا يتم استخدامه في التدريب الدقيق على مجموعة بيانات Adience. تُظهر التجارب التي أجريناها فعالية طريقة RoR في التنبؤ بعمر وجنس الأشخاص في البيئات الحقيقية، حيث تتفوّق على الطرق الأخرى المستندة إلى CNN. في النهاية، يُحقق النموذج RoR-152 مع مجموعة بيانات IMDB-WIKI-101 والآلتين المذكورتين نتائج جديدة تمثل الحد الأقصى للتقدم (state-of-the-art) على معيار Adience.