HyperAIHyperAI
منذ 18 أيام

التعلم التكيفي لتمثيل تعبير الوجه من خلال Etiquettes C-F والتوليد التلقيني

{Hangyu Li; Nannan Wang; Xinpeng Ding; Xi Yang; Xinbo Gao}
الملخص

تمثّل اعتراف التعبيرات الوجهية أهمية كبيرة في التحقيقات الجنائية والترفيه الرقمي. وفي الظروف غير المقيدة، تُظهر المجموعات الحالية للتعبيرات الوجهية توازنًا فئويًا مرتفعًا، كما أن التشابه بين التعبيرات مرتفع جدًا. وغالبًا ما تسعى الطرق السابقة إلى تحسين أداء اعتراف التعبيرات الوجهية من خلال هياكل شبكات أعمق أو أوسع، مما يؤدي إلى زيادة تكاليف التخزين والمعالجة الحاسوبية. في هذه الورقة، نقترح دالة خسارة مراقبة متكيفة جديدة تُسمى AdaReg، والتي تعيد وزن معاملات أهمية الفئات بهدف معالجة التوازن الفئوي غير المتوازن، وزيادة قدرة التمييز في تمثيلات التعبيرات. مستوحاة من نمط التفكير البشري، تم تصميم استراتيجية جديدة للوسوم تُعرف بـ (C-F) المُبسّطة-الدقيقة، لتوجيه النموذج من التصنيف السهل إلى الصعب، وذلك لتصنيف تمثيلات شديدة التشابه. بناءً على ذلك، نقترح إطارًا تدريبيًا جديدًا يُسمى آلية التعليم العاطفي (EEM)، التي تُنقل المعرفة من خلال شبكة معلّم مُلمّة (KTN) وشبكة طالب تتعلم ذاتيًا (STSN). بشكل محدد، تقوم KTN بدمج مخرجات المسارات المُبسّطة والدقيقة، وتعلم تمثيلات التعبيرات من الأسهل إلى الأصعب. وبإشراف KTN المُدرّبة مسبقًا وخبرات التعلم الحالية، يمكن لـ STSN تحقيق أقصى أداء ممكن، مع تقليل حجم KTN الأصلية. أظهرت التجارب الواسعة على معايير عامة نتائج متفوّقة مقارنةً بالإطارات الحديثة، حيث بلغت الدقة 88.07% على مجموعة RAF-DB، و63.97% على AffectNet، و90.49% على FERPlus.