HyperAIHyperAI
منذ 15 أيام

مجموعة بيانات متعددة الوسائط للتعرف على المشاعر في السخرية

Anupama Ray, Shubham Mishra, Apoorva Nunna, Pushpak Bhattacharyya
مجموعة بيانات متعددة الوسائط للتعرف على المشاعر في السخرية
الملخص

بينما تم دراسة تحليل المشاعر والانفعالات بشكل واسع، ظلت العلاقة بين السخرية والانفعالات موضوعًا شبه غير مستكشف. قد يحمل التعبير الساخر نوعًا متعددًا من الانفعالات الكامنة وراءه. على سبيل المثال، يخفي عبارة "أنا أحب أن أُتجاهل" شعورًا بالحزن، بينما تعبر عبارة "هاتفِي رائعة بوقت تشغيل بطارية لا يتجاوز 15 دقيقة!" عن الإحباط. وكشف الانفعال الكامن وراء التعبير الساخر ليس أمرًا سهلًا، لكنه مهمة بالغة الأهمية. نتولى مهمة كشف الانفعال في التعبير الساخر، وهي مهمة لم تُدرس من قبل، إلى حد علمينا، حتى الآن. نبدأ بقاعدة بيانات جديدة للسخرية متعددة الوسائط (MUStARD) التي تم تزويدها مسبقًا بـ 9 أنواع من الانفعالات. نقوم بتحديد وتصحيح 343 تسمية انفعال خاطئة (من أصل 690 تسمية). ونضاعف حجم قاعدة البيانات، ونُسَمّيها بانفعالات مُضافة إلى مؤشرات القيمة (valence) والتوتر (arousal)، وهي مؤشرات مهمة لقياس شدة الانفعال. وأخيرًا، نُسَمّي كل تعبير ساخر بواحدة من أربع فئات للسخرية: " propositional"، "embedded"، "like-prefixed"، و"illocutionary"، بهدف تعزيز أبحاث كشف السخرية. وتم إجراء تجارب شاملة باستخدام نماذج دمج متعددة الوسائط (النص، الصوت، الفيديو)، مما يُحدث معيارًا مرجعيًا لكشف الدقة في الانفعالات ضمن السخرية، ويتفوق على أحدث النماذج في كشف السخرية. ونُطلق قاعدة البيانات المُحسَّنة بannotations متعددة، مع رفع الشفرة المصدرية لأغراض البحث: https://github.com/apoorva-nunna/MUStARD_Plus_Plus

مجموعة بيانات متعددة الوسائط للتعرف على المشاعر في السخرية | أحدث الأوراق البحثية | HyperAI