شبكة ميزات مختلطة ذات انتباه ثنائي الاتجاه للتعرف على التعبيرات الوجهية
في السنوات الأخيرة، لاقت تقنية تمييز التعبيرات الوجهية (FER) اهتمامًا كبيرًا في مجال بحوث الرؤية الحاسوبية. تقدم هذه الورقة شبكة مبتكرة تُسمى شبكة الميزات المختلطة ذات الانتباه ثنائي الاتجاه (DDAMFN)، المصممة خصيصًا لمهام تمييز التعبيرات الوجهية، وتتميز بخصائص قوية وخفيفة الوزن في الوقت ذاته. يتكوّن هيكل الشبكة من مكونين رئيسيين: شبكة الميزات المختلطة (MFN) التي تُشكل الهيكل الأساسي، وشبكة الانتباه ثنائي الاتجاه (DDAN) التي تعمل كجزء العُلوي. لتعزيز قدرة الشبكة في MFN، تم استخلاص ميزات متماسكة باستخدام نوى ذات أحجام مختلطة. علاوةً على ذلك، تم اقتراح رأس جديد يُسمى الانتباه ثنائي الاتجاه (DDA)، والذي يُولّد خرائط انتباه باتجاهين، مما يمكّن النموذج من التقاط الاعتماديات على المدى الطويل بشكل فعّال. ولتحسين الدقة بشكل إضافي، تم تقديم آلية فقدان انتباه جديدة لـ DDAN، حيث تركز الرؤوس المختلفة على مناطق مختلفة من المدخل. أظهرت التقييمات التجريبية على عدة مجموعات بيانات عامة شائعة الاستخدام، بما في ذلك AffectNet وRAF-DB وFERPlus، تفوق DDAMFN مقارنةً بالنماذج الأخرى الحالية، مما يُثبت أنها النموذج الرائد في مجال تمييز التعبيرات الوجهية.