التعلم الفعّال للميزات الوجهية باستخدام الشبكات العصبية التلافيفية المستندة إلى تجميع واسع

أثبتت الطرق المتعددة (Ensemble methods)، التي بُنيت تقليديًا على نماذج مستقلة مُدرَّبة دون ارتباط متبادل، أنها طرق فعّالة في تقليل الخطأ التعميمي المتبقي، مما يؤدي إلى طرق موثوقة ودقيقة تُستخدم في التطبيقات الواقعية. ومع ذلك، في سياق التعلم العميق، فإن تدريب مجموعة من الشبكات العميقة يكون مكلفًا جدًا ويؤدي إلى تكرار كبير، وهو ما يُعد غير فعّال. في هذه الورقة، نقدم تجارب على المجموعات ذات التمثيل المشترك (Ensembles with Shared Representations - ESRs) القائمة على الشبكات التلافيفية (convolutional networks)، بهدف إظهار كفاءتها في معالجة البيانات وقابلية التوسع بالنسبة لمجموعات بيانات ضخمة من التعبيرات الوجهية، من حيث الجوانب الكمية والكيفية. ونُظهر أن التكرار والحمل الحسابي يمكن تقليلهما بشكل كبير من خلال تعديل مستوى التفرع في نموذج ESR، دون فقدان التنوّع أو القدرة التعميمية، وهما عنصرا أساسية لأداء المجموعة. وتشير التجارب على مجموعات بيانات ضخمة إلى أن نماذج ESR تقلل من الخطأ التعميمي المتبقي على مجموعتي بيانات AffectNet وFER+، وتصل إلى أداء يُعادل الأداء البشري، وتفوق الطرق الرائدة في مجال التعرف على التعبيرات الوجهية في البيئات الطبيعية (in the wild) باستخدام مفاهيم العاطفة (emotion) والتأثير النفسي (affect).