HyperAIHyperAI

Command Palette

Search for a command to run...

فصل المشاعر وتعرفها من التعبير الوجهي من خلال إنشاء الوجه المحايد باستخدام تحولات الرؤية

Jia Li Jiantao Nie Dan Guo Richang Hong Meng Wang

الملخص

لقد حظيت التعلم التمثيلي وفصل الميزات بحثًا كبيرًا في مجال التعرف على التعبيرات الوجهية (FER). تشكل الغموض الداخلي في تسميات المشاعر تحديًا أمام الطرق التقليدية لتعلم التمثيل المراقب. علاوةً على ذلك، فإن التعلم المباشر للتحويل من صورة تعبير وجهي إلى تسمية مشاعر يفتقر إلى إشارات مراقبة صريحة لالتقاط الميزات الوجهية الدقيقة. في هذه الورقة، نقترح نموذجًا جديدًا لـ FER يُسمى "مُصوّر الوجه البوكر" أو PF-ViT، بهدف معالجة هذه التحديات. يهدف PF-ViT إلى فصل التعبير العاطفي غير الحساس للتشويش وتمييزه من صورة وجه ثابتة من خلال إنشاء "وجه البوكر" المقابل لها، دون الحاجة إلى صور مزدوجة. مستوحى من نظام ترميز حركات الوجه (Facial Action Coding System)، ننظر إلى الوجه التعبيري كنتيجة مجمعة لسلسلة من حركات العضلات الوجهية على وجه "البوكر" (أي وجه خالٍ من المشاعر). يستخدم PF-ViT نماذج Vision Transformers القياسية، حيث يتم تدريب مكوناته أولًا كمُشفِّرات مُقنعة (Masked Autoencoders) على مجموعة بيانات واسعة من التعبيرات الوجهية دون تسميات عاطفية، مما يُنتج تمثيلات ممتازة. ثم نُدرّب نموذج PF-ViT باستخدام إطار عمل GAN. أثناء التدريب، يُعزز المهمة المساعدة لإنشاء وجه البوكر فصل المكونات العاطفية عن المكونات غير العاطفية، مما يوجه نموذج التعرف على التعبيرات الوجهية لالتقاط التفاصيل الوجهية التمييزية بشكل شامل. تُظهر النتائج الكمية والكيفية فعالية طريقتنا، حيث تفوقت على أحدث النماذج في أربع مجموعات بيانات شهيرة لـ FER.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp