{Leon Derczynski Nanna Inie Philine Zeinert}

الملخص
العنف الجنسي عبر الإنترنت، وهو فئة من لغة التهديدات الإلكترونية، يحمل عواقب اجتماعية خطيرة وضارة. ورغم أن الكشف التلقائي عن اللغة المهينة تجاه النساء عبر الإنترنت أمر ضروري، فإنه يشكل تحديات معقدة في جمع البيانات، ووضع العلامات عليها، وتصحيح التحيز، نظرًا لتعقيد وتنوع هذه البيانات من الناحية اللغوية. تقدم هذه الورقة ثلاث إسهامات في هذا المجال: أولاً، نصف التصميم التفصيلي لعملية الترميز التكرارية وكتاب الترميز لدينا. ثانيًا، نقدّم تصنيفًا شاملاً للعلامات لترميز العنف الجنسي في اللغة المكتوبة الطبيعية. وأخيرًا، نقدم مجموعة بيانات عالية الجودة من المنشورات المُعلَّمة، تم استخلاصها من منشورات وسائل التواصل الاجتماعي.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| hate-speech-detection-on-bajer-danish | AOM mBERT | F1: 0.8549 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.