DH-FBK في مهام SemEval-2022 المهمة 4: الاستفادة من عدم الاتفاق بين المُعلّقين والمنظورات المتعددة للبيانات للكشف عن اللغة التبجيلية

الاستخدام الدقيق والغالبًا ما يكون غير واعٍ للغة التفوقية والتحفظية (PCL) في وسائل الإعلام التي تصل إلى جمهور واسع يغذي بشكل غير مرغوب فيه الصور النمطية ويعزز علاقات القوة-المعرفة، مما يُسهم في ترسيخ التمييز ضد المجتمعات الضعيفة. وبسبب طبيعتها الذاتية والدقيقة، يظل كشف PCL مشكلة مفتوحة وصعبة، سواء بالنسبة للأساليب الحاسوبية أو المُعلّقين البشريين. في هذا البحث، نصف الأنظمة التي قدمها فريق DH-FBK ضمن مهمة SemEval-2022 المُعَرَّفة بـ Task 4، والتي تهدف إلى اكتشاف PCL الموجهة ضد المجتمعات الضعيفة في النصوص الإعلامية الإنجليزية. مُحفَّزين بذاتية التفسير البشري، نقترح الاستفادة من عدم اليقين والاختلاف بين المُعلّقين لالتقاط التدرجات الدقيقة لـ PCL ضمن إطار تعلّم متعدد المهام ومتعدد المنظورات. تُظهر منهجيتنا نتائج تنافسية، وتتفوّق بشكل كبير على النماذج الأساسية، وتُسجّل ترتيبًا في الجزء العلوي الأيسر من لوحة التصنيف في كلا المهام: الكشف عن PCL والتصنيف. ومن الجدير بالذكر أن منهجيتنا لا تعتمد على أي بيانات خارجية أو تجميع نماذج، مما يجعلها حلًا عمليًا وجذابًا للتطبيق في البيئات الحقيقية.