HyperAIHyperAI
vor 11 Tagen

Tiefen Lernmodelle für die mehrsprachige Erkennung von Hassrede

Sai Saketh Aluru, Binny Mathew, Punyajoy Saha, Animesh Mukherjee
Tiefen Lernmodelle für die mehrsprachige Erkennung von Hassrede
Abstract

Die Erkennung von Hassrede stellt eine herausfordernde Aufgabe dar, wobei die meisten verfügbaren Datensätze in nur einer Sprache – Englisch – vorliegen. In diesem Artikel führen wir eine umfassende Analyse multilingualer Hassrede in neun Sprachen aus 16 verschiedenen Quellen durch. Wir beobachten, dass in niedrig ressourcenreichen Umgebungen einfache Modelle wie LASER-Embeddings in Kombination mit logistischer Regression die besten Ergebnisse erzielen, während in ressourcenreichen Umgebungen BERT-basierte Modelle überlegen sind. Bei Zero-Shot-Klassifikation erreichen Sprachen wie Italienisch und Portugiesisch beachtliche Leistungen. Der von uns vorgeschlagene Rahmen kann als effiziente Lösung für sprachlich benachteiligte Sprachen dienen. Zudem eignen sich diese Modelle als solide Baselines für zukünftige Aufgaben zur multilingualen Erkennung von Hassrede. Wir haben unseren Code sowie die experimentellen Einstellungen für andere Forscher unter https://github.com/punyajoy/DE-LIMIT öffentlich gemacht.

Tiefen Lernmodelle für die mehrsprachige Erkennung von Hassrede | Neueste Forschungsarbeiten | HyperAI