HyperAIHyperAI
منذ 2 أشهر

ديكسبريشن: شبكة عصبية تقنية التعلم العميقة باستخدام التحويلات الشعاعية المتعددة للأغراض التعرف على التعابير

Peter Burkert; Felix Trier; Muhammad Zeshan Afzal; Andreas Dengel; Marcus Liwicki
ديكسبريشن: شبكة عصبية تقنية التعلم العميقة باستخدام التحويلات الشعاعية المتعددة للأغراض التعرف على التعابير
الملخص

نقترح هندسة شبكة عصبية تلافيفية (CNN) للاعتراف بتعبيرات الوجه. تعتمد الهندسة المقترحة بشكل مستقل عن أي استخراج للخصائص يُجري باليد وتؤدي بشكل أفضل من النهج القائمة على الشبكات العصبية التلافيفية التي تم اقتراحها سابقًا. نقوم بتوضيح الخصائص المستخرجة تلقائيًا والتي تم تعلمها بواسطة الشبكة لتوفير فهم أفضل. يتم استخدام مجموعات البيانات القياسية، مثل Extended Cohn-Kanade (CKP) وقاعدة بيانات تعبيرات الوجه MMI، لتقييم كمي. على مجموعة CKP، يحقق النهج الحالي الأكثر تقدمًا باستخدام الشبكات العصبية التلافيفية دقةً تبلغ 99.2٪. بالنسبة لمجموعة بيانات MMI، تعتبر الدقة الحالية الأفضل للاعتراف بالمشاعر هي 93.33٪. تحقق الهندسة المقترحة دقةً تبلغ 99.6٪ لـ CKP و98.63٪ لـ MMI، مما يجعل أدائها أفضل من الحالة الأكثر تقدمًا باستخدام الشبكات العصبية التلافيفية. يعتبر اعتراف تعبيرات الوجه بشكل آلي له طيف واسع من التطبيقات مثل التفاعل بين الإنسان والحاسوب وأنظمة السلامة. هذا يعود إلى حقيقة أن الإشارات غير اللفظية هي أشكال مهمة للتواصل ولها دور محوري في التواصل بين الأفراد. يؤيد أداء الهيكلة المقترحة فعاليتها واستخدامها الموثوق به في التطبيقات العملية.