Command Palette
Search for a command to run...
Warum ist es Hassrede? Masked Rationale-Vorhersage für erklärbare Hassrede-Erkennung
Warum ist es Hassrede? Masked Rationale-Vorhersage für erklärbare Hassrede-Erkennung
Jiyun Kim Byounghan Lee Kyung-Ah Sohn
Zusammenfassung
Bei einem Modell zur Erkennung von Hassrede sollten neben der Detektionsleistung zwei entscheidende Aspekte berücksichtigt werden: Bias und Erklärbarkeit. Hassrede kann nicht allein anhand der Anwesenheit bestimmter Wörter erkannt werden: Das Modell muss in der Lage sein, ähnlich wie Menschen zu reasoning und nachvollziehbar sein. Um die Leistung in Bezug auf diese beiden Aspekte zu verbessern, schlagen wir die Masked Rationale Prediction (MRP) als Zwischenaufgabe vor. MRP ist eine Aufgabe, bei der die maskierten menschlichen Begründungen – Ausschnitte eines Satzes, die die Grundlage für menschliche Urteile bilden – anhand der umgebenden Tokens sowie der unmaskierten Begründungen vorhergesagt werden sollen. Da das Modell seine Schlussfolgerungsfähigkeit anhand von Begründungen durch MRP erlernt, führt es bei der Erkennung von Hassrede robust in Bezug auf Bias und Erklärbarkeit. Die vorgeschlagene Methode erreicht im Allgemeinen Spitzenleistungen in verschiedenen Metriken und demonstriert somit ihre Wirksamkeit für die Erkennung von Hassrede.