Modèles d'apprentissage profond pour la détection de la haine multilingue

La détection de la haine en ligne constitue un problème complexe, la plupart des jeux de données disponibles étant actuellement limités à une seule langue : l’anglais. Dans cet article, nous menons une analyse à grande échelle de la haine multilingue dans 9 langues provenant de 16 sources différentes. Nous constatons que dans les contextes à faible ressource linguistique, les modèles simples tels que les embeddings LASER combinés à une régression logistique obtiennent les meilleurs résultats, tandis que dans les contextes à forte ressource, les modèles basés sur BERT se révèlent plus performants. En ce qui concerne la classification zéro-shot, des langues comme l’italien et le portugais atteignent des résultats satisfaisants. Notre cadre proposé peut servir de solution efficace pour les langues à faible ressource. Ces modèles peuvent également constituer de bons points de départ pour des travaux futurs sur la détection multilingue de la haine. Nous avons rendu public notre code ainsi que nos paramètres expérimentaux afin de faciliter la recherche collaborative à l’adresse suivante : https://github.com/punyajoy/DE-LIMIT.