PAtt-Lite: MobileNet خفيف الوزن للقطع والانتباه للتعرف على التعبيرات الوجهية الصعبة

تمثّل اعتراف التعبيرات الوجهية (FER) مشكلة في التعلم الآلي تتناول التعرف على التعبيرات الوجهية البشرية. وعلى الرغم من التحسينات التي أُحرزت في الأداء خلال السنوات الأخيرة، ما زال التعرف على التعبيرات في البيئات الطبيعية (in the wild) وتحت الظروف الصعبة يشكل تحديًا. في هذا البحث، تم اقتراح شبكة خفيفة الوزن تعتمد على كتلة مُنتَظَرة وانتباه (Patch and Attention)، مبنية على MobileNetV1، وتُعرف باسم PAtt-Lite، بهدف تحسين أداء FER في الظروف الصعبة. تم استخدام نسخة مقطوعة من MobileNetV1 المُدرّب مسبقًا على ImageNet كمُستخرج للسمات الأساسي (backbone) للطريقة المقترحة. بدلًا من الطبقات المقطوعة، تم اقتراح كتلة استخلاص الكتل (patch extraction block) لاستخلاص السمات المحلية المهمة في الوجه، بهدف تعزيز تمثيل MobileNetV1، خاصة في الظروف الصعبة. كما تم اقتراح فئة انتباه (attention classifier) لتحسين عملية التعلّم من خرائط السمات المُقطعة الناتجة عن المستخرج الخفيف جدًا للسمات. أثبتت النتائج التجريبية على قواعد بيانات المعايير العامة فعالية الطريقة المقترحة. حيث حقق PAtt-Lite أداءً من الدرجة الأولى (state-of-the-art) على قواعد بيانات CK+، RAF-DB، FER2013، FERPlus، بالإضافة إلى المجموعات المُختارة من الظروف الصعبة لـ RAF-DB وFERPlus.