HyperAIHyperAI
منذ 11 أيام

إيثوس: مجموعة بيانات للكشف عن الخطاب الكراهية عبر الإنترنت

Ioannis Mollas, Zoe Chrysopoulou, Stamatis Karlos, Grigorios Tsoumakas
إيثوس: مجموعة بيانات للكشف عن الخطاب الكراهية عبر الإنترنت
الملخص

الخطاب الكراهية عبر الإنترنت هو مشكلة حديثة في مجتمعنا تزداد باستمرار بفضل استغلالها للثغرات الموجودة في الأنظمة التي تميز معظم منصات وسائل التواصل الاجتماعي. ويُعزز هذا الظاهرة بشكل رئيسي من خلال التعليقات المسيئة، سواء أثناء التفاعل بين المستخدمين أو في شكل سياق متعدد الوسائط تم نشره. في الوقت الحاضر، تمتلك شركات ضخمة منصات يستخدمها ملايين المستخدمين يوميًا، ويبدو أن الحماية من التعرض لهذا النوع من الظواهر أصبحت ضرورية للامتثال للتشريعات المعمول بها والحفاظ على مستوى عالٍ من جودة الخدمة. إن نظام قوي وموثوق للكشف عن المحتوى المتعلق بالخطاب الكراهية ومنع رفعه سيكون له تأثير كبير على مجتمعنا المتصل رقميًا. إن العديد من جوانب حياتنا اليومية مرتبطة بشكل لا جدال به بملفاتنا الاجتماعية، مما يجعلنا عرضة لسلوكيات مسيئة. ونتيجة لذلك، فإن غياب آليات دقيقة للكشف عن الخطاب الكراهية سيؤدي إلى تدهور شديد في تجربة المستخدم، في حين أن أخطاء تشغيل هذه الآليات ستنطوي على العديد من المخاوف الأخلاقية. في هذا البحث، نقدّم "ETHOS"، وهي مجموعة بيانات نصية بنسختين: ثنائية العلامة ومتعددة العلامات، مبنية على تعليقات من يوتيوب وريدت، وتم التحقق من صحتها باستخدام منصة التجميع الجماعي "Figure-Eight". علاوة على ذلك، نقدّم بروتوكول التصنيف المستخدم لإنشاء هذه المجموعة: عملية اختيار نشطة لتوازن البيانات وفقًا للجوانب المختلفة المحددة. ونفترض أننا، حتى مع الحصول على كمية صغيرة من البيانات المُعلّمة من عملية طويلة ومُرهقة كهذه، يمكننا ضمان وجود حالات من الخطاب الكراهية في المواد المدروسة.

إيثوس: مجموعة بيانات للكشف عن الخطاب الكراهية عبر الإنترنت | أحدث الأوراق البحثية | HyperAI