مجموعة بيانات نصوص مشاهد الدراما الكورية للتعرف على المشاعر في المحادثات
فهم المشاعر في المحادثات يُعد مهمة صعبة، نظرًا لأن الجمل غالبًا ما تحتوي على معاني ضمنية لا تُفهم بشكل عام عند فصلها عن سياقها. إن الاستخدام الفعّال للمعلومات السياقية أمر ضروري للتعرف على المشاعر في المحادثات. توفر العديد من المجموعات المنشورة للبيانات معلومات سياقية لسياقات مثل الرسائل النصية عبر الإنترنت، والروبوتات الحوارية (الشات بوت)، وحوارات الأفلام. ومع ذلك، فإن مجموعات الحوار هذه تُجمع باختيار مواقف حوارية مثالية، وبالتالي لا تتضمن تنوعًا كبيرًا في طول الحوار وعدد المشاركين. ونتيجة لذلك، قد لا تكون هذه المجموعات مناسبة للتعرف على المشاعر في نصوص أفلام مكتوبة، حيث تتباين عدد المتكلمين وطول الجمل الصوتية في المشاهد. نقدم مجموعة بيانات حوارية مستندة إلى نصوص مسلسلات تلفزيونية كورية لتحليل المشاعر في ظل السياق السيني. إن مجموعة بيانات نصوص مشاهد الدراما الكورية للتعرف على المشاعر (KD-EmoR) هي مجموعة بيانات حوارية مبنية على النصوص. نقوم بتحليل ثلاث فئات من المشاعر المعقدة: البهجة، والانزعاج النفسي، والحياد، في مشاهد مسلسل تلفزيوني، بهدف إنشاء مجموعة بيانات متاحة للجمهور لدعم الأبحاث المستقبلية. وقد طوّرنا نموذجًا عميقًا يراعي السياق لتصنيف المشاعر باستخدام السياق على مستوى المتكلم والسياق السيني، وحققنا مقياس F1 قدره 0.63 على المجموعة المطروحة.