HyperAIHyperAI
منذ 17 أيام

فصل المشاعر وتعرفها من التعبير الوجهي من خلال إنشاء الوجه المحايد باستخدام تحولات الرؤية

Jia Li, Jiantao Nie, Dan Guo, Richang Hong, Meng Wang
فصل المشاعر وتعرفها من التعبير الوجهي من خلال إنشاء الوجه المحايد باستخدام تحولات الرؤية
الملخص

لقد حظيت التعلم التمثيلي وفصل الميزات بحثًا كبيرًا في مجال التعرف على التعبيرات الوجهية (FER). تشكل الغموض الداخلي في تسميات المشاعر تحديًا أمام الطرق التقليدية لتعلم التمثيل المراقب. علاوةً على ذلك، فإن التعلم المباشر للتحويل من صورة تعبير وجهي إلى تسمية مشاعر يفتقر إلى إشارات مراقبة صريحة لالتقاط الميزات الوجهية الدقيقة. في هذه الورقة، نقترح نموذجًا جديدًا لـ FER يُسمى "مُصوّر الوجه البوكر" أو PF-ViT، بهدف معالجة هذه التحديات. يهدف PF-ViT إلى فصل التعبير العاطفي غير الحساس للتشويش وتمييزه من صورة وجه ثابتة من خلال إنشاء "وجه البوكر" المقابل لها، دون الحاجة إلى صور مزدوجة. مستوحى من نظام ترميز حركات الوجه (Facial Action Coding System)، ننظر إلى الوجه التعبيري كنتيجة مجمعة لسلسلة من حركات العضلات الوجهية على وجه "البوكر" (أي وجه خالٍ من المشاعر). يستخدم PF-ViT نماذج Vision Transformers القياسية، حيث يتم تدريب مكوناته أولًا كمُشفِّرات مُقنعة (Masked Autoencoders) على مجموعة بيانات واسعة من التعبيرات الوجهية دون تسميات عاطفية، مما يُنتج تمثيلات ممتازة. ثم نُدرّب نموذج PF-ViT باستخدام إطار عمل GAN. أثناء التدريب، يُعزز المهمة المساعدة لإنشاء وجه البوكر فصل المكونات العاطفية عن المكونات غير العاطفية، مما يوجه نموذج التعرف على التعبيرات الوجهية لالتقاط التفاصيل الوجهية التمييزية بشكل شامل. تُظهر النتائج الكمية والكيفية فعالية طريقتنا، حيث تفوقت على أحدث النماذج في أربع مجموعات بيانات شهيرة لـ FER.