Deep-Emotion: التعرف على تعبيرات الوجه باستخدام شبكة انتباهية تلافيفية

التعرف على تعبيرات الوجه كان مجال بحث نشط خلال العقود القليلة الماضية، وما زال يشكل تحديًا بسبب التباين الكبير داخل الفئات. ت依赖于手工设计的特征,如 SIFT (مميزات الارتباط الذاتي المقياس-ثابت)、HOG (المميزات التوجيهية للHistograms of Oriented Gradients) 和 LBP (نمط.binary pattern) 的传统方法,随后在图像或视频数据库上训练分类器。修正后的翻译如下:التعرف على تعبيرات الوجهكان التعرف على تعبيرات الوجه مجال بحث نشط خلال العقود القليلة الماضية، وما زال يشكل تحديًا بسبب التباين الكبير داخل الفئات. تعتمد النهج التقليدية لهذه المشكلة على ميزات مصممة يدويًا مثل SIFT (مميزات الارتباط الذاتي المقياس-ثابت)، HOG (مميزات هستوغرام الجراد المتوجيه)، و LBP (نمط البكسل الثنائي المحلي)، ثم يتم تدريب تصنيف على قاعدة بيانات من الصور أو الفيديوهات.أدى معظم هذه الأعمال إلى أداء معقول في مجموعات البيانات التي تم التقاط صورها في ظروف مراقبة، لكنها فشلت في تحقيق نفس الأداء الجيد في مجموعات البيانات الأكثر تحديًا والتي تحتوي على المزيد من الاختلاف في الصور وأجزاء غير كاملة من الوجه.في السنوات الأخيرة، اقترح العديد من الأعمال إطارًا نهائيًا للاعتراف بتعبيرات الوجه باستخدام نماذج التعلم العميق. رغم الأداء الأفضل لهذه الأعمال، يبدو أن هناك مجال كبير للتحسين.في هذا العمل، نقترح نهجًا يستند إلى الشبكات العصبية الإنتباهية (الانتباهية) للتعلم العميق، والذي يمكنه التركيز على أجزاء مهمة من الوجه ويحقق تحسينًا كبيرًا على النماذج السابقة في عدة مجموعات بيانات، بما في ذلك FER-2013 و CK+ و FERG و JAFFE.نستخدم أيضًا تقنية تصور قادرة على تحديد المناطق المهمة في الوجه لاكتشاف العواطف المختلفة بناءً على خرج المصنف. من خلال النتائج التجريبية، نظهر أن العواطف المختلفة تكون حساسة لأجزاء مختلفة من الوجه.