HyperAIHyperAI
il y a 11 jours

Modèles d'apprentissage profond pour la détection de la haine multilingue

Sai Saketh Aluru, Binny Mathew, Punyajoy Saha, Animesh Mukherjee
Modèles d'apprentissage profond pour la détection de la haine multilingue
Résumé

La détection de la haine en ligne constitue un problème complexe, la plupart des jeux de données disponibles étant actuellement limités à une seule langue : l’anglais. Dans cet article, nous menons une analyse à grande échelle de la haine multilingue dans 9 langues provenant de 16 sources différentes. Nous constatons que dans les contextes à faible ressource linguistique, les modèles simples tels que les embeddings LASER combinés à une régression logistique obtiennent les meilleurs résultats, tandis que dans les contextes à forte ressource, les modèles basés sur BERT se révèlent plus performants. En ce qui concerne la classification zéro-shot, des langues comme l’italien et le portugais atteignent des résultats satisfaisants. Notre cadre proposé peut servir de solution efficace pour les langues à faible ressource. Ces modèles peuvent également constituer de bons points de départ pour des travaux futurs sur la détection multilingue de la haine. Nous avons rendu public notre code ainsi que nos paramètres expérimentaux afin de faciliter la recherche collaborative à l’adresse suivante : https://github.com/punyajoy/DE-LIMIT.

Modèles d'apprentissage profond pour la détection de la haine multilingue | Articles de recherche récents | HyperAI