Command Palette
Search for a command to run...
ExpNet: تعبيرات وجوه ثلاثية الأبعاد عميقة بدون نقاط مرجعية
ExpNet: تعبيرات وجوه ثلاثية الأبعاد عميقة بدون نقاط مرجعية
الملخص
نُقدّم طريقة تعتمد على التعلم العميق لتقدير معاملات التعبير الوجهي ثلاثية الأبعاد. على عكس الدراسات السابقة، لا تعتمد عمليةنا على أساليب كشف نقاط الوجه كخطوة وسيلة. وقد أظهرت الدراسات الحديثة أن يمكن تدريب شبكة عصبية متعددة الطبقات (CNN) على استخلاص تمثيلات دقيقة وتمييزية لنموذج مورفابيل ثلاثي الأبعاد (3DMM)، مباشرة من كثافة الصورة. وباستبعاد كشف نقاط الوجه، تمكن هذه الأساليب من تقدير الأشكال للوجوه المغطاة، حتى في ظروف مشاهدة غير منضبطة (in-the-wild) لم تُرَ من قبل. ونُبنى على هذه الأساليب من خلال إثبات أن التعبيرات الوجهية يمكن أيضًا تقديرها باستخدام نهج عميق ومقاوم، يعتمد على عدم الحاجة إلى كشف نقاط الوجه. تُطبَّق شبكة ExpNet ذات التصميم العميق مباشرة على كثافة صورة الوجه، وتعيد تقييم متجه بعمر 29 بعدًا يمثل معاملات التعبير ثلاثية الأبعاد. ونُقدّم طريقة فريدة لجمع البيانات اللازمة لتدريب هذه الشبكة، مستفيدين من مقاومة الشبكات العميقة لوجود أخطاء في العلامات التدريبية. كما نُقدّم وسيلة جديدة لتقييم دقة المعاملات المقدرة للتعبيرات: من خلال قياس مدى قدرتها على التقاط المشاعر الوجهية في معايير التعرف على المشاعر CK+ وEmotiW-17. ونُظهر أن ExpNet يُنتج معاملات تعبير تُميّز بين المشاعر الوجهية بشكل أفضل من تلك التي تُستخرج باستخدام تقنيات كشف نقاط الوجه المتطورة. علاوة على ذلك، يزداد هذا الميزة كلما انخفض حجم الصورة، مما يدل على أن ExpNet أكثر مقاومة لتغيرات الحجم مقارنةً بأساليب كشف نقاط الوجه. وأخيرًا، عند نفس مستوى الدقة، فإن ExpNet أسرع بعشرات أو مئات المرات مقارنةً بالبدائل الأخرى.