إطار سلسلة الانحدار الهرمي للاعتراف بانفجارات الصوت العاطفية

كطريقة شائعة لإشارات العواطف من خلال الأصوات غير اللغوية، تلعب الانفجارات الصوتية (VB) دورًا مهمًا في التفاعلات الاجتماعية اليومية. فهم ونمذجة الانفجارات الصوتية البشرية أمر ضروري لتطوير الذكاء الاصطناعي القوي والعام. يجذب استكشاف النهج الحاسوبي لفهم الانفجارات الصوتية اهتمامًا بحثيًا متزايدًا. في هذا العمل، نقترح إطارًا هرميًا، يستند إلى نماذج الانحدار المتسلسلة، للاعتراف بالعواطف من الانفجارات الصوتية، حيث يتم اعتبار العلاقات المتعددة صراحة: (أ) بين الحالات العاطفية والثقافات المتنوعة؛ (ب) بين الفضاء العاطفي ذي الأبعاد المنخفضة (الاستثارة والتقييم) والفضاء العاطفي ذي الأبعاد المرتفعة (10 فئات عاطفية)؛ و(ج) بين الفئات العاطفية المختلفة داخل الفضاء ذي الأبعاد المرتفعة. للتعامل مع تحدي ندرة البيانات، نستخدم أيضًا تمثيلات التعلم الذاتي الإشرافي (SSL) مع وحدات تجميع طبقية وزمنية. شاركت النظم المقترحة في تحدي ACII للانفجارات الصوتية العاطفية (A-VB) عام 2022 وحلت أولاً في مهام "TWO" و"CULTURE". تظهر النتائج التجريبية المستندة إلى مجموعة بيانات تحدي ACII 2022 الأداء المتفوق للنظام المقترح وكفاءة اعتبار العلاقات المتعددة باستخدام نماذج سلسلة الانحدار الهرمية.