Détection du langage offensant et des discours de haine pour le danois

La présence de langage offensif sur les plateformes de médias sociaux et les implications qu'elle soulève constituent une préoccupation majeure dans la société moderne. Étant donné la quantité énorme de contenu créé chaque jour, des méthodes automatiques sont nécessaires pour détecter et traiter ce type de contenu. Jusqu'à présent, la plupart des recherches se sont concentrées sur la résolution du problème pour la langue anglaise, alors que le problème est multilingue.Nous avons construit un jeu de données danois contenant des commentaires générés par les utilisateurs provenant de \textit{Reddit} et \textit{Facebook}. Il comprend des commentaires générés par les utilisateurs provenant de diverses plateformes de médias sociaux, et, à notre connaissance, il s'agit du premier jeu de données de ce type. Notre jeu de données est annoté pour capturer différents types et cibles de langage offensif. Nous avons développé quatre systèmes de classification automatique, chacun conçu pour fonctionner à la fois en anglais et en danois. Dans la détection du langage offensif en anglais, le système le plus performant obtient un score F1 moyen pondéré de $0{,}74$, tandis que le système le plus performant pour le danois atteint un score F1 moyen pondéré de $0{,}70$. Dans la détection de savoir si un message offensif est ciblé ou non, le système le plus performant pour l'anglais obtient un score F1 moyen pondéré de $0{,}62$, alors que le système le plus performant pour le danois atteint un score F1 moyen pondéré de $0{,}73$. Enfin, dans la détection du type de cible dans un message offensif ciblé, le système le plus performant pour l'anglais obtient un score F1 moyen pondéré de $0{,}56$, et le système le plus performant pour le danois atteint un score F1 moyen pondéré de $0{,}63$.Notre travail concerne à la fois l'anglais et le danois et capture les types et les cibles du langage offensif. Nous présentons des méthodes automatiques permettant de détecter différents types de langage offensif tels que les discours haineux (hate speech) et le cyberharcèlement (cyberbullying).