vor 2 Monaten

Erkennung von obszöner Sprache und Hassrede für Dänisch

Gudbjartur Ingi Sigurbergsson; Leon Derczynski

Abstract

Die Präsenz von beleidigender Sprache auf sozialen Medienplattformen und die damit verbundenen Implikationen stellen zunehmend eine große Sorge in der modernen Gesellschaft dar. Angesichts der enormen Menge an täglich erstelltem Inhalt sind automatische Methoden erforderlich, um diesen Typ von Inhalt zu erkennen und zu behandeln. Bislang hat sich die Mehrheit der Forschung darauf konzentriert, das Problem für die englische Sprache zu lösen, während es sich um ein mehrsprachiges Problem handelt.Wir erstellen einen dänischen Datensatz, der nutzergenerierte Kommentare aus \textit{Reddit} und \textit{Facebook} enthält. Er umfasst nutzergenerierte Kommentare von verschiedenen sozialen Medienplattformen und ist, soweit wir wissen, der erste seines Art. Unser Datensatz ist annotiert, um verschiedene Arten und Ziele beleidigender Sprache zu erfassen. Wir entwickeln vier automatische Klassifizierungssysteme, jedes davon ist so gestaltet, dass es sowohl für die englische als auch für die dänische Sprache funktioniert. Bei der Erkennung von beleidigender Sprache im Englischen erreicht das beste System einen durchschnittlichen Makro-F1-Wert von $0{,}74$, während das beste System für Dänisch einen durchschnittlichen Makro-F1-Wert von $0{,}70$ erreicht. Bei der Erkennung, ob ein beleidigender Beitrag gerichtet ist oder nicht, erreicht das beste System für Englisch einen durchschnittlichen Makro-F1-Wert von $0{,}62$, während das beste System für Dänisch einen durchschnittlichen Makro-F1-Wert von $0{,}73$ erreicht. Schließlich bei der Erkennung des Ziels in einem gerichteten beleidigenden Beitrag erreicht das beste System für Englisch einen durchschnittlichen Makro-F1-Wert von $0{,}56$, und das beste System für Dänisch einen durchschnittlichen Makro-F1-Wert von $0{,}63$.Unsere Arbeit sowohl für die englische als auch für die dänische Sprache erfasst den Typ und die Ziele beleidigender Sprache und präsentiert automatische Methoden zur Erkennung verschiedener Arten beleidigender Sprache wie Hassrede (hate speech) und Cybermobbing (cyberbullying).