HyperAIHyperAI
منذ 18 أيام

التعرف على التعبيرات الوجهية في البيئة الطبيعية من خلال خسارة المركز المُركّزة العميقة

{Xiaojun Qi, Amir Hossein Farzaneh}
التعرف على التعبيرات الوجهية في البيئة الطبيعية من خلال خسارة المركز المُركّزة العميقة
الملخص

إن تعلّم خصائص تمييزية لتمييز التعبيرات الوجهية (FER) في البيئات الطبيعية (in the wild) باستخدام الشبكات العصبية التلافيفية (CNNs) يُعد مهمة غير سهلة بسبب التباين الكبير داخل الفئة وتشابه الفئات المختلفة. وقد تم اعتماد نُهج التعلم القياسي العميق (DML)، مثل خسارة المركز (center loss) ومشتقاتها، بالتزامن مع خسارة سويفتم (softmax loss) في العديد من طرق FER لتعزيز القدرة التمييزية للخصائص المُتعلّمة في فضاء التضمين (embedding space). ومع ذلك، فإن إعطاء نفس مستوى التوجيه (supervision) لكل خصائص التمثيل قد يؤدي إلى تضمين خصائص غير ذات صلة، مما يُضعف في النهاية قدرة الخوارزمية على التعميم. نُقدّم في هذا العمل طريقة تُسمى خسارة المركز الانتباهي العميق (DACL) تُعدّل بشكل تلقائي اختيار مجموعة فرعية من عناصر الخصائص المهمة لتعزيز التمييز. تعتمد DACL على آلية انتباه (attention mechanism) لتقدير أوزان انتباه مرتبطة بأهمية الخصائص، باستخدام الخرائط المكانية الوسطى (intermediate spatial feature maps) في الشبكة العصبية التلافيفية كسياق. وتُطبّق هذه الأوزان المُقدّرة على الصيغة النادرة (sparse formulation) لخسارة المركز، مما يسمح بتحقيق كثافة داخلية (intra-class compactness) وانفصال بين الفئات (inter-class separation) بشكل انتقائي للبيانات ذات الصلة في فضاء التضمين. أظهرت دراسة واسعة على ملفين شائعي الاستخدام لبيانات FER في البيئات الطبيعية تفوق الطريقة المقترحة مقارنةً بالأساليب الحالية المتطورة.