{Kenneth Liang Church Renjie Huang Jiahong Zheng Xingyu Yuan Cai}
الملخص
تمييز العواطف من خلال الكلام (SER) يصنف الكلام إلى فئات عاطفية مثل: سعيد، غاضب، حزين، ومحايد. في الآونة الأخيرة، تم تطبيق التعلم العميق على مهمة تمييز العواطف من خلال الكلام. تُقدّم هذه الورقة إطارًا للتعلم المتعدد المهام (MTL) لتنفيذ مهام التعرف على الكلام إلى نص وتصنيف العواطف في آنٍ واحد، باستخدام نموذج عصبي عميق متكامل يعتمد على wav2vec-2.0. أظهرت التجارب على معيار IEMOCAP أن الطريقة المقترحة تحقق أداءً متقدمًا على مستوى الحالة الحالية في مهمة SER. بالإضافة إلى ذلك، أثبتت الدراسة التحليلية (أبلاسيون) فعالية الإطار المُقترح للتعلم المتعدد المهام.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| speech-emotion-recognition-on-iemocap | SER with MTL | F1: - UA CV: 0.7815 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.
البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
Hyper Newsletters
اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp