Ad-Corre: خسارة تعتمد على الارتباط التكيفي للتعرف على التعبيرات الوجهية في البيئات الطبيعية
التعرف التلقائي على التعبيرات الوجهية في البيئات الطبيعية (FER) باستخدام الشبكات العصبية العميقة ما زال يمثل تحديًا بسبب التباينات داخل الفئة والتشابهات بين الفئات في الصور الوجهية. وتعتبر التعلم العميق للمترية (DML) واحدة من الطرق الشائعة لمعالجة هذه المشكلات من خلال تحسين القدرة التمييزية للميزات المدمجة المُستخلصة. في هذه الورقة، نقترح خسارة مُعدّلة تُسمى خسارة الارتباط التكيفية (Ad-Corre) لتأطير الشبكة نحو إنتاج متجهات مدمجة ذات ارتباط عالٍ بين العينات داخل الفئة، وارتباط منخفض بين العينات بين الفئات. تتكوّن خسارة Ad-Corre من ثلاث مكونات تُسمى: مُميّز الميزات (Feature Discriminator)، ومُميّز المتوسط (Mean Discriminator)، ومُميّز التضمين (Embedding Discriminator). صممنا مكون مُميّز الميزات لتوجيه الشبكة لخلق متجهات مدمجة ذات ارتباط عالٍ إذا كانت تابعة لفئة متشابهة، وارتباط منخفض إذا كانت تابعة لفئات مختلفة. بالإضافة إلى ذلك، يُوجه مكون مُميّز المتوسط الشبكة إلى جعل متجهات الميزات المتوسطة لكل فئة أقل تشابهًا مع بعضها البعض. استخدمنا شبكة Xception كهيكل أساسي (backbone) لنماذجنا، وخلافًا للعمل السابق، اقترحنا فضاءً مدمجًا يحتوي على k متجه مميز. ثم يُعاقب مكون مُميّز التضمين الشبكة على إنتاج متجهات مدمجة غير متشابهة. تم تدريب نموذجنا باستخدام مزيج من دوال الخسارة المقترحة، تُعرف بـ "خسارة Ad-Corre"، بالجمع مع خسارة التباين العابر (cross-entropy). وحقّق النموذج دقة اعتراف متميزة على مجموعات بيانات AffectNet وRAF-DB وFER-2013. وتشير التجارب الواسعة والدراسة التحليلية (ablation study) إلى قوة طريقة العمل في التعامل بكفاءة مع مهام التعرف على التعبيرات الوجهية الصعبة في البيئات الطبيعية.