HyperAIHyperAI
منذ 2 أشهر

نظام موحد لتحديد العدوانية في النصوص المختلطة باللغة الإنجليزية والنصوص الأحادية اللغة

Anant Khandelwal; Niraj Kumar
نظام موحد لتحديد العدوانية في النصوص المختلطة باللغة الإنجليزية والنصوص الأحادية اللغة
الملخص

زيادة استخدام منصات التواصل الاجتماعي قد رفعت مستوى خطر العدوانية، مما يؤدي إلى الضغط النفسي ويؤثر سلباً على حياة الأفراد مثل المعاناة النفسية، السلوك العدائي، وعدم احترام الآخرين. تحتوي معظم هذه المحادثات على لغات مختلطة بالرموز (code-mixed languages)[28]. بالإضافة إلى ذلك، الطريقة المستخدمة للتعبير عن الأفكار أو أسلوب التواصل تختلف من منصة إلى أخرى (مثلاً، تختلف أساليب التواصل في تويتر وفيسبوك). كل هذا قد زاد من تعقيد المشكلة. لحل هذه المشاكل، قمنا بتطوير هندسة تعلم عميقة متعددة الوسائط موحدة وقوية تعمل مع مجموعة بيانات الإنجليزية المختلطة بالرموز ومجموعة بيانات الإنجليزية الأحادية اللغة على حد سواء. يستخدم النظام الذي تم تصميمه الخصائص النفسولinguistic والخصائص اللغوية الأساسية جداً. تتضمن هندستنا التعلم العميق المتعدد الوسائط شبكات الـ CNN الهرمية العميقة (Deep Pyramid CNN)، LSTM ثنائية الاتجاه مع التجميع (Pooled BiLSTM)، وـ RNN المنفصلة (Disconnected RNN) مع تضمين Glove وFastText معاً. أخيراً، يتخذ النظام القرار بناءً على متوسط النماذج. قمنا بتقييم نظامنا على مجموعة بيانات TRAC 2018 الإنجليزية المختلطة بالرموز وعلى مجموعة بيانات الإنجليزية الأحادية اللغة التي تم الحصول عليها من Kaggle. أظهرت نتائج التجارب أن نظامنا المقترح يتفوق على جميع الأساليب السابقة في كل من مجموعة البيانات الإنجليزية المختلطة بالرموز ومجموعة البيانات الإنجليزية الأحادية اللغة.

نظام موحد لتحديد العدوانية في النصوص المختلطة باللغة الإنجليزية والنصوص الأحادية اللغة | أحدث الأوراق البحثية | HyperAI