تعلم من الجميع: إزالة اتساق الانتباه للتنبؤ بتعبيرات الوجه ذات التسميات الضوضائية

تمثّل معالجة التعرف على التعبيرات الوجهية (FER) مع العلامات الضوضائية تحديًا أكبر من المهام التقليدية لتصنيف العلامات الضوضائية، وذلك بسبب التشابه بين الفئات والغموض المرتبط بالتصنيف. تتركز الدراسات الحديثة في معالجة هذه المشكلة على استبعاد العينات ذات الخسارة العالية. في هذا البحث، نستكشف معالجة العلامات الضوضائية من منظور جديد متعلق بتعلم الميزات. ونجد أن نماذج FER تتذكّر العينات الضوضائية من خلال التركيز على جزء من الميزات التي يمكن اعتبارها مرتبطة بالعلامات الضوضائية، بدلًا من التعلّم من جميع الميزات التي تؤدي إلى الحقيقة الكامنة. مستوحى من هذا الملاحظة، نقترح طريقة جديدة تُسمّى "اتساق الانتباه المُحذوف" (EAC) لقمع العينات الضوضائية تلقائيًا أثناء عملية التدريب. وبشكل محدد، نستخدم أولًا اتساق المعنى العكسي للصور الوجهية لتصميم إطار عمل غير متوازن. ثم نُزيل عشوائيًا جزءًا من الصور المدخلة، ونستخدم اتساق الانتباه العكسي لمنع النموذج من التركيز على جزء معين من الميزات. تتفوّق طريقة EAC بشكل كبير على أحدث الطرق في مجال FER مع العلامات الضوضائية، كما تُظهر أداءً ممتازًا في المهام الأخرى ذات عدد كبير من الفئات مثل CIFAR100 وTiny-ImageNet. يمكن الاطلاع على الكود عبر الرابط التالي: https://github.com/zyh-uaiaaaa/Erasing-Attention-Consistency.