HyperAIHyperAI
منذ 18 أيام

تعلم الميزات العميقة متعددة المقياس الشاملة والانتباه المحلي للتمييز العاطفي الوجه في البيئات الطبيعية

{Shanmin Wang, Qingshan Liu, Zengqun Zhao}
الملخص

تماشُر اعتراف التعبيرات الوجهية (FER) في البيئات الطبيعية (in the wild) اجتذب اهتمامًا واسعًا، حيث يُعد التغطية (الإغلاق) وتغير الوضعية (pose variation) من المشكلات الأساسية. في هذا البحث، تم اقتراح شبكة متعددة المقاييس العالمية ومحور الانتباه المحلي (MA-Net) لمعالجة مسألة اعتراف التعبيرات الوجهية في البيئات الطبيعية. بشكل محدد، تتكون الشبكة المقترحة من ثلاث مكونات رئيسية: مُستخرج الميزات الأولي، ووحدة المقياس المتعدد، ووحدة الانتباه المحلي. يُستخدم مستخرج الميزات الأولي لاستخراج ميزات متوسطة المستوى مسبقًا، بينما تُستخدم وحدة المقياس المتعدد لدمج الميزات ذات الحقول المستقبلية المختلفة، مما يقلل من حساسية الشبكات العميقة للإغلاق وتغير الوضعية. أما وحدة الانتباه المحلي، فتُوجه الشبكة لتركيز انتباهها على الميزات المميزة محليًا، مما يُخفف من تأثيرات التغطية والوضعيات غير الأمامية على أداء اعتراف التعبيرات الوجهية في البيئات الطبيعية. أظهرت التجارب الواسعة أن الشبكة المقترحة MA-Net تحقق نتائج رائدة في مجالها (state-of-the-art) على عدة معايير معيارية لاعتراف التعبيرات الوجهية في البيئات الطبيعية، ألا وهي: CAER-S، AffectNet-7، AffectNet-8، RAFDB، وSFEW، بدرجات دقة تبلغ على التوالي 88.42% و64.53% و60.29% و88.40% و59.40%.