الشبكة التحويلية الهرمية للتعرف على العاطفة على مستوى الجملة

على الرغم من التقدم الكبير في كشف المشاعر في النصوص، تبقى هناك العديد من المشكلات التي تحتاج إلى حل في مجال تمييز المشاعر على مستوى الجملة (ULER). في هذا البحث، نتناول بعض التحديات المرتبطة بـ ULER في أنظمة المحادثة. (1) يمكن أن يُعبّر نفس الجملة عن مشاعر مختلفة حسب السياق أو من متحدثين مختلفين. (2) من الصعب التقاط المعلومات السياقية على المدى الطويل بشكل فعّال. (3) على عكس مسائل التصنيف النصي التقليدية، يُدعم هذا المهمة بعدد محدود من المجموعات البيانات، معظمها يحتوي على محادثات أو نصوص محادثات غير كافية. لمعالجة هذه المشكلات، نقترح إطارًا هرميًا يعتمد على نموذج الترانسفورمر (باستثناء التوضيحات الأخرى، فإن مصطلح "الترانسفورمر" في هذا البحث يشير عادةً إلى جزء الترميز في نموذج الترانسفورمر)، يتضمن ترانسفورمرًا على المستوى السفلي لتمثيل المدخلات على مستوى الكلمة، وتُستخدم ترانسفورمرات على المستوى العلوي لالتقاط السياق الخاص بتمثيلات الجملة. نستخدم نموذجًا مُدرّبًا مسبقًا، يُعرف بـ BERT (تمثيلات الترميز الثنائية من الترانسفورمرات)، كجزء من الترانسفورمر على المستوى السفلي، وهو ما يعادل إدخال بيانات خارجية إلى النموذج، ويُخفّف إلى حد ما من مشكلة نقص البيانات. بالإضافة إلى ذلك، نُضيف ترميزات المُتحدث (speaker embeddings) إلى النموذج لأول مرة، مما يمكّن النموذج من التقاط التفاعل بين المتكلمين. أظهرت التجارب على ثلاث مجموعات بيانات للمشاعر في المحادثات (Friends، EmotionPush، وEmoryNLP) أن النموذج الهرمي المُقترح حقق تحسنًا بنسبة 1.98% و2.83% و3.94% على التوالي مقارنةً بالأساليب المتقدمة حاليًا على كل مجموعة بيانات من حيث مقياس F1 المكاني (macro-F1).