شبكة عميقة موجهة بالقمة للاعتراف بتعابير الوجه

الدوال الهدف لتدريب الشبكات العميقة المخصصة لمهام التعرف على الوجه، مثل التعرف على تعبيرات الوجه (FER)، عادةً ما تأخذ كل عينة بشكل مستقل. في هذا البحث، نقدم شبكة عميقة جديدة موجهة بالذروة (PPDN) تستخدم عينة ذات تعبير ذروة (عينة سهلة) لإشراف الاستجابات الخاصة بالميزات الوسيطة لعينة ذات تعبير غير ذروة (عينة صعبة) من نفس النوع ومن نفس الشخص. يمكن بالتالي غرس عملية تطور التعبير من التعبير غير الذروة إلى التعبير الذروة ضمن الشبكة بشكل ضمني لتحقيق الثباتية بالنسبة لشدات التعبير. تم اقتراح إجراء خاص للانتشار العكسي، وهو قمع التدرج الذروة (PGS)، لتدريب الشبكة. يدفع هذا الإجراء استجابات الميزات في الطبقات الوسيطة للعينات ذات التعبير غير الذروة نحو تلك الخاصة بالعينات ذات التعبير الذروة المقابل لها، مع تجنب العكس. هذا يمنع تدهور قدرة التعرف على العينات ذات التعبير الذروة بسبب التداخل من نظائرها ذات التعبير غير الذروة. أظهرت المقارنات الواسعة على مجموعتين شهيرتين من بيانات FER، Oulu-CASIA و CK+، تفوق PPDN على أفضل طرق FER الحالية، بالإضافة إلى مزايا كل من هيكل الشبكة واستراتيجية الأمثلية. علاوةً على ذلك، تم إثبات أن PPDN هي هندسة عامة يمكن توسيعها إلى مهام أخرى عن طريق تعريف صحيح للعينات ذات الذروة والعينات غير الذروة. يتم تأكيد هذا من خلال التجارب التي أظهرت أداءً رائداً في مجال التعرف على الوجه المستقل للوضعية باستخدام مجموعة بيانات Multi-PIE.