HyperAIHyperAI

Command Palette

Search for a command to run...

HateBERT: Neutrainieren von BERT zur Erkennung von beleidigender Sprache im Englischen

Tommaso Caselli Valerio Basile Jelena Mitrović Michael Granitzer

Zusammenfassung

In diesem Artikel stellen wir HateBERT vor, ein neu trainiertes BERT-Modell zur Erkennung von beleidigender Sprache im Englischen. Das Modell wurde auf RAL-E, einem großskaligen Datensatz an Reddit-Kommentaren im Englischen aus Gemeinschaften, die aufgrund von Beleidigungen, Missbrauch oder Hassrede gesperrt wurden, trainiert, den wir gesammelt und der Öffentlichkeit zur Verfügung gestellt haben. Wir präsentieren die Ergebnisse einer detaillierten Vergleichsstudie zwischen einem allgemein vortrainierten Sprachmodell und der durch die Nachtrainierung mit Beiträgen aus gesperrten Gemeinschaften gewonnenen, auf beleidigende Sprache ausgerichteten Variante an drei englischsprachigen Datensätzen für Aufgaben der Erkennung von Beleidigungen, Missbrauch und Hassrede. In allen Datensätzen übertrifft HateBERT das entsprechende allgemeine BERT-Modell. Zudem diskutieren wir eine Reihe von Experimenten, die den Transfer von allgemeinen vortrainierten Sprachmodellen und ihren spezifisch auf beleidigende Sprache ausgerichteten Varianten zwischen den Datensätzen vergleichen und zeigen, dass die Übertragbarkeit durch die Kompatibilität der annotierten Phänomene beeinflusst wird.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
HateBERT: Neutrainieren von BERT zur Erkennung von beleidigender Sprache im Englischen | Paper | HyperAI