نظام موحد لتحديد العدوانية في النصوص المختلطة باللغة الإنجليزية والنصوص الأحادية اللغة

زيادة استخدام منصات التواصل الاجتماعي قد رفعت مستوى خطر العدوانية، مما يؤدي إلى الضغط النفسي ويؤثر سلباً على حياة الأفراد مثل المعاناة النفسية، السلوك العدائي، وعدم احترام الآخرين. تحتوي معظم هذه المحادثات على لغات مختلطة بالرموز (code-mixed languages)[28]. بالإضافة إلى ذلك، الطريقة المستخدمة للتعبير عن الأفكار أو أسلوب التواصل تختلف من منصة إلى أخرى (مثلاً، تختلف أساليب التواصل في تويتر وفيسبوك). كل هذا قد زاد من تعقيد المشكلة. لحل هذه المشاكل، قمنا بتطوير هندسة تعلم عميقة متعددة الوسائط موحدة وقوية تعمل مع مجموعة بيانات الإنجليزية المختلطة بالرموز ومجموعة بيانات الإنجليزية الأحادية اللغة على حد سواء. يستخدم النظام الذي تم تصميمه الخصائص النفسولinguistic والخصائص اللغوية الأساسية جداً. تتضمن هندستنا التعلم العميق المتعدد الوسائط شبكات الـ CNN الهرمية العميقة (Deep Pyramid CNN)، LSTM ثنائية الاتجاه مع التجميع (Pooled BiLSTM)، وـ RNN المنفصلة (Disconnected RNN) مع تضمين Glove وFastText معاً. أخيراً، يتخذ النظام القرار بناءً على متوسط النماذج. قمنا بتقييم نظامنا على مجموعة بيانات TRAC 2018 الإنجليزية المختلطة بالرموز وعلى مجموعة بيانات الإنجليزية الأحادية اللغة التي تم الحصول عليها من Kaggle. أظهرت نتائج التجارب أن نظامنا المقترح يتفوق على جميع الأساليب السابقة في كل من مجموعة البيانات الإنجليزية المختلطة بالرموز ومجموعة البيانات الإنجليزية الأحادية اللغة.