اكتشاف العنصرية الجنسية في تعليقات الصحف الإلكترونية الألمانية باستخدام تضمينات النص المفتوحة المصدر (فريق GDA، مهمة مشتركة GermEval2024 رقم 1: GerMS-Detect، المهام الفرعية 1 و2، المسار المغلق)

التمييز الجنسي في تعليقات وسائل الإعلام عبر الإنترنت هو تحدي شائع يظهر غالبًا بشكل خفي، مما يعقد جهود المoderation حيث يمكن أن تختلف تفسيرات ما يعتبر تمييزًا جنسيًا بين الأفراد. ندرس الترميز النصي المفتوح المصدر الأحادي والمتعدد اللغات لاكتشاف التمييز الجنسي والبغضاء ضد النساء بشكل موثوق في التعليقات الإلكترونية باللغة الألمانية من صحيفة نمساوية. لاحظنا أن المصنفات التي تم تدريبها على الترميز النصي تتبع بقُرب أحكام المشتغلين البشريين. أظهرت طريقتنا أداءً قويًا في تحدي GermEval 2024 GerMS-Detect الجزء الأول، حيث حققت متوسط درجة F1 الكبيرة 0.597 (المركز الرابع، كما ذُكر على Codabench). كما أنها تنبأت بدقة بتوزيع الأحكام البشرية في GerMS-Detect الجزء الثاني، بمتوسط مسافة Jensen-Shannon 0.301 (المركز الثاني). يشير كفاءة الحوسبة لطريقتنا إلى إمكانية تطبيقات قابلة للتوسع عبر مختلف اللغات والسياقات اللغوية.请注意,为了更符合阿拉伯语的表达习惯,我对一些词汇和句子结构进行了调整。以下是更正后的版本:التمييز الجنسي في تعليقات وسائل الإعلام الرقمية هو تحدي شائع يظهر غالبًا بشكل خفي، مما يعقد جهود الرقابة حيث يمكن أن تختلف تفسيرات ما يعتبر تمييزًا جنسيًا بين الأفراد. ندرس الترميز النصي المفتوح المصدر الأحادي والمتعدد اللغات لاكتشاف التمييز الجنسي والبغضاء ضد النساء بشكل موثوق في التعليقات الإلكترونية باللغة الألمانية من صحيفة نمساوية. لاحظنا أن المصنفات التي تم تدريبها على الترميز النصي تتبع بقُرب أحكام المشتغلين البشريين. أظهرت طريقتنا أداءً قويًا في تحدي GermEval 2024 GerMS-Detect الجزء الأول (Subtask 1)، حيث حققت متوسط درجة F1 الكبيرة 0.597 (المركز الرابع، كما ذُكر على Codabench). كما أنها تنبأت بدقة بتوزيع الأحكام البشرية في GerMS-Detect الجزء الثاني (Subtask 2)، بمتوسط مسافة Jensen-Shannon 0.301 (المركز الثاني). يشير كفاءة الحوسبة لطريقتنا إلى إمكانية تطبيقات قابلة للتوسع عبر مختلف اللغات والسياقات اللغوية.希望这个版本更加符合您的要求。如果有任何进一步的修改建议,请随时告知。