HyperAIHyperAI
il y a 11 jours

Détection de la haine utilisant des embeddings statiques BERT

Gaurav Rajput, Narinder Singh punn, Sanjay Kumar Sonbhadra, Sonali Agarwal
Détection de la haine utilisant des embeddings statiques BERT
Résumé

Avec la montée en popularité des plateformes de médias sociaux, les discours de haine se sont imposés comme une préoccupation majeure, car ils consistent en des propos abusifs visant à stigmatiser des caractéristiques spécifiques de groupes, telles que le sexe, la religion ou l’ethnie, dans le but de propager la violence. Autrefois, ces discours étaient principalement diffusés verbalement, mais avec l’expansion des technologies, certaines personnes utilisent désormais délibérément les réseaux sociaux pour propager la haine par le biais de publications, de partages ou de commentaires. Que ce soit lors des attaques aux mosquées de Christchurch ou dans le cadre des actes de haine contre les Asiatiques en Occident, il a été observé que les auteurs de tels actes ont été profondément influencés par des textes haineux présents en ligne. Bien que des systèmes d’intelligence artificielle soient actuellement mis en œuvre pour signaler ces contenus, l’un des principaux défis réside dans la réduction du taux de faux positifs (c’est-à-dire la classification erronée de contenus non haineux comme haineux), afin que ces systèmes puissent détecter efficacement les discours de haine sans compromettre la liberté d’expression. Dans cet article, nous utilisons le jeu de données ETHOS pour la détection des discours de haine et analysons les performances d’un classificateur de discours de haine en remplaçant ou en intégrant les embeddings de mots (fastText (FT), GloVe (GV) ou FT + GV) par des embeddings statiques BERT (BE). À l’issue d’expérimentations étendues, il ressort que le réseau de neurones se comporte mieux avec les embeddings statiques BERT par rapport à l’utilisation de FT, GV ou FT + GV comme embeddings de mots. En comparaison avec un modèle BERT fine-tuné, une métrique qui s’est notablement améliorée est la spécificité.

Détection de la haine utilisant des embeddings statiques BERT | Articles de recherche récents | HyperAI