HyperAIHyperAI
vor 8 Tagen

Detektion von Feindseligkeit im Hindi unter Verwendung vortrainierter Sprachmodelle

Ojasv Kamal, Adarsh Kumar, Tejas Vaidhya
Detektion von Feindseligkeit im Hindi unter Verwendung vortrainierter Sprachmodelle
Abstract

Die Zahl feindlicher Inhalte auf sozialen Plattformen nimmt stetig zu. Dies hat die Notwendigkeit einer effektiven Erkennung solcher Beiträge geschaffen, um geeignete Maßnahmen ergreifen zu können. Obwohl in letzter Zeit erhebliche Fortschritte im Bereich der Erkennung feindlicher Inhalte im Englischen erzielt wurden, sind vergleichbare Arbeiten in indischen Sprachen äußerst selten. In diesem Paper wird ein Transfer-Learning-basiertes Verfahren vorgestellt, um soziale Medienbeiträge (z. B. Twitter, Facebook) im Hindi-Devanagari-Schriftsystem als feindlich oder nicht-feindlich zu klassifizieren. Feindliche Beiträge werden zusätzlich analysiert, um festzustellen, ob sie Hass, Falschinformationen, Verleumdung oder Beleidigungen enthalten. Das vorgestellte Verfahren nutzt auf Aufmerksamkeit basierende vortrainierte Modelle, die an Hindi-Daten fine-tuned wurden, wobei die Aufgabe „Feindlich/Nicht-feindlich“ als Hilfsaufgabe dient. Die Merkmale dieser Modelle werden anschließend gefusst, um die Klassifikation für die weiteren Untertasken zu ermöglichen. Auf diese Weise wird ein robustes und konsistentes Modell ohne Ensemble-Techniken oder komplexes Vorverarbeiten erreicht. Die Ergebnisse unseres Ansatzes wurden im Rahmen der CONSTRAINT-2021 Shared Task zur Erkennung feindlicher Beiträge präsentiert, wo unser Modell mit dem dritten Platz in Bezug auf den gewichteten fein granularen F1-Score herausragend abschnitt.

Detektion von Feindseligkeit im Hindi unter Verwendung vortrainierter Sprachmodelle | Neueste Forschungsarbeiten | HyperAI