EmoWOZ: مجموعة ضخمة من البيانات ونموذج ترميز لتمييز المشاعر في أنظمة المحادثة الموجهة للمهمات

القدرة على التعرف على المشاعر تمنح الذكاء الاصطناعي التفاعلي لغة حوارية لمسة إنسانية. وعلى الرغم من الحدّ من الاهتمام الكبير الذي حظي به المشاعر في المحادثات غير الرسمية، تبقى المشاعر في المحادثات الموجهة نحو المهام دون معالجة كافية. وهذا يعود إلى أن المشاعر والنجاح في المحادثة يلعبان دورين متساويين الأهمية في النظام الطبيعي. تُعاني المجموعات الحالية المُعلّمة بمشاعر في المحادثات الموجهة نحو المهام من قلة الحجم، ونقص في ثراء العلامات، وقلة في التوفر العام، مما يشكل عقبة أمام المهام اللاحقة. ولوضع أساس لدراسات حول المشاعر في المحادثات الموجهة نحو المهام، نقدّم EmoWOZ، وهي مجموعة بيانات كبيرة تم تسميتها يدويًا بمشاعر في المحادثات الموجهة نحو المهام. تعتمد EmoWOZ على MultiWOZ، وهي مجموعة بيانات متعددة المجالات للمحادثات الموجهة نحو المهام. وتحتوي EmoWOZ على أكثر من 11 ألف محادثة، مع أكثر من 83 ألف تسمية مشاعر للجمل الصادرة من المستخدم. وبالإضافة إلى محادثات نوع "وِزارد أوف أوز" من MultiWOZ، قمنا بجمع محادثات بين البشر والآلات ضمن نفس مجموعة المجالات، بهدف تغطية شاملة لطيف المشاعر المختلفة التي قد تحدث خلال عمر نظام محادثة يعتمد على البيانات. إلى حدّ معرفتنا، فإن هذه هي أول مجموعة بيانات مفتوحة المصدر كبيرة الحجم من نوعها. ونُقدّم.scheme تسمية مشاعر جديدة مصممة خصيصًا للمحادثات الموجهة نحو المهام. ونُقدّم مجموعة من النتائج التجريبية التي تُظهر جدوى هذه المجموعة في التعرف على المشاعر وتحليل الحالة في المحادثات الموجهة نحو المهام.