CAGE: استنتاج التعبير الموجه بالمشاعر الدائرية

فهم المشاعر والتعبيرات هو مهمة تُعدّ ذات اهتمام متعدد التخصصات، وخاصةً في سياق تحسين تجربة المستخدم. وعلى عكس التصور الشائع، أظهرت الأبحاث أن المشاعر ليست كيانات منفصلة، بل توجد على طول طيف مستمر. ويختلف الناس في فهمهم للمشاعر المنفصلة بسبب عوامل متنوعة، تشمل الخلفية الثقافية، والتجارب الفردية، والتحيّزات المعرفية. وبالتالي، فإن معظم النماذج المستخدمة في فهم التعبيرات، خصوصًا تلك التي تعتمد على فئات منفصلة، تُعدّ ذات تحيّزات متأصلة. في هذه الورقة البحثية، نقدّم تحليلًا مقارنًا متعمقًا لبيانتين شائعتين (AffectNet و EMOTIC)، مع تضمين مكونات نموذج الدائرة العاطفية (circumplex model of affect). بالإضافة إلى ذلك، نقترح نموذجًا مُعدًّا لتنبؤ التعبيرات الوجهية، مُصممًا خصيصًا للتطبيقات الخفيفة. باستخدام بنية نموذج MaxViT صغيرة الحجم، نقيّم تأثير استخدام علامات الفئات المنفصلة في التدريب مقابل استخدام علامات القيمة (valence) والتوتر (arousal) المستمرة. ونُظهر أن أخذ القيمة والتوتر بعين الاعتبار إلى جانب العلامات الفئوية المنفصلة يُسهم بشكل كبير في تحسين استنتاج التعبيرات. ويتفوق النموذج المقترح على النماذج الحالية المُتفوّقة في مجموعة بيانات AffectNet، ليصبح أفضل نموذج أداءً في استنتاج القيمة والتوتر، حيث يُسجّل انخفاضًا بنسبة 7% في متوسط الجذر التربيعي للخطأ (RMSE). يمكن العثور على نصوص التدريب وأوزان النموذج المدربة لإعادة إنتاج نتائجنا من خلال الرابط التالي: https://github.com/wagner-niklas/CAGE_expression_inference.