DDRel: مجموعة بيانات جديدة لتصنيف العلاقات الشخصية في الحوارات الثنائية

التحول في أسلوب اللغة بين الأفراد خلال الحوارات هو قدرة مثيرة للاهتمام وغريزية تقريبًا لدى البشر. فهم العلاقات الشخصية من محتوى اللغة هو أيضًا خطوة حاسمة نحو فهم أعمق للحوارات. تركز الدراسات السابقة بشكل أساسي على استخراج العلاقات بين الكيانات المسمّاة في النصوص. في هذا البحث، نقترح مهمة تصنيف العلاقات بين المتحدثين بناءً على حوارهم. جمعنا سيناريوهات أفلام من موقع IMSDb، وقمنا بتصنيف علامات العلاقات لكل جلسة حوارية وفقًا لـ 13 علاقة محددة مسبقًا. يتكون مجموعة البيانات المُشَرَّحة (DDRel) من 6300 جلسة حوار ثنائية بين 694 زوجًا من المتحدثين، بإجمالي 53,126 جملة. كما قمنا ببناء مهمات تصنيف العلاقات على مستوى الجلسات وعلى مستوى الأزواج باستخدام نماذج أساسية معترف بها على نطاق واسع. تظهر نتائج التجارب أن هذه المهمة تمثل تحديًا للنماذج الحالية وأن مجموعة البيانات ستكون مفيدة للأبحاث المستقبلية.