HyperAIHyperAI

Command Palette

Search for a command to run...

Erkennung von obszöner Sprache und Hassrede für Dänisch

Gudbjartur Ingi Sigurbergsson; Leon Derczynski

Zusammenfassung

Die Präsenz von beleidigender Sprache auf sozialen Medienplattformen und die damit verbundenen Implikationen stellen zunehmend eine große Sorge in der modernen Gesellschaft dar. Angesichts der enormen Menge an täglich erstelltem Inhalt sind automatische Methoden erforderlich, um diesen Typ von Inhalt zu erkennen und zu behandeln. Bislang hat sich die Mehrheit der Forschung darauf konzentriert, das Problem für die englische Sprache zu lösen, während es sich um ein mehrsprachiges Problem handelt.Wir erstellen einen dänischen Datensatz, der nutzergenerierte Kommentare aus \textit{Reddit} und \textit{Facebook} enthält. Er umfasst nutzergenerierte Kommentare von verschiedenen sozialen Medienplattformen und ist, soweit wir wissen, der erste seines Art. Unser Datensatz ist annotiert, um verschiedene Arten und Ziele beleidigender Sprache zu erfassen. Wir entwickeln vier automatische Klassifizierungssysteme, jedes davon ist so gestaltet, dass es sowohl für die englische als auch für die dänische Sprache funktioniert. Bei der Erkennung von beleidigender Sprache im Englischen erreicht das beste System einen durchschnittlichen Makro-F1-Wert von 0,740{,}740,74, während das beste System für Dänisch einen durchschnittlichen Makro-F1-Wert von 0,700{,}700,70 erreicht. Bei der Erkennung, ob ein beleidigender Beitrag gerichtet ist oder nicht, erreicht das beste System für Englisch einen durchschnittlichen Makro-F1-Wert von 0,620{,}620,62, während das beste System für Dänisch einen durchschnittlichen Makro-F1-Wert von 0,730{,}730,73 erreicht. Schließlich bei der Erkennung des Ziels in einem gerichteten beleidigenden Beitrag erreicht das beste System für Englisch einen durchschnittlichen Makro-F1-Wert von 0,560{,}560,56, und das beste System für Dänisch einen durchschnittlichen Makro-F1-Wert von 0,630{,}630,63.Unsere Arbeit sowohl für die englische als auch für die dänische Sprache erfasst den Typ und die Ziele beleidigender Sprache und präsentiert automatische Methoden zur Erkennung verschiedener Arten beleidigender Sprache wie Hassrede (hate speech) und Cybermobbing (cyberbullying).


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp