لماذا يُعدّ خطاباً كراهية؟ تنبؤ بالأساس المُقنّع للكشف القابل للتفسير عن خطاب الكراهية

في نموذج كشف الخطاب الكراهية، يجب أخذ جوانب حاسمة إضافية بعين الاعتبار إلى جانب أداء الكشف: التحيز والقابلية للتفسير. لا يمكن تحديد الخطاب الكراهية بناءً فقط على وجود كلمات محددة؛ بل يجب أن يكون النموذج قادرًا على التفكير كما يفعل البشر، ويجب أن يكون قابلاً للتفسير. ولتحسين الأداء فيما يتعلق بهذه الجوانب، نقترح مهمة تُسمى "توقّع الأسباب المُقنَّعة المُقنّعة" (Masked Rationale Prediction - MRP) كمهمة وسيطة. تتمثل مهامة MRP في توقع الأسباب البشرية المُقنّعة — أي القطع القصيرة من الجملة التي تُعدّ أساسًا لقرارات البشر — من خلال الاستناد إلى الرموز المحيطة مع الأسباب غير المقنّعة. وبمجرد تعلّم النموذج لقدرته على الاستدلال بناءً على هذه الأسباب من خلال مهامة MRP، فإنه يُظهر أداءً قويًا في كشف الخطاب الكراهية من حيث التحيز والقابلية للتفسير. ويحقق الأسلوب المقترح أداءً يُعدّ من أفضل الأداءات المُحققة في مجموعة متنوعة من المقاييس، مما يُظهر فعاليته في كشف الخطاب الكراهية.