HyperAIHyperAI
il y a 12 jours

Tu ne haïras point : Contre la haine en ligne

{Pawan Goyal, Prajwal Singhania, Animesh Mukherje, Suman Kalyan Maity, Subham Rajgaria, Hardik Tharad, Binny Mathew}
Tu ne haïras point : Contre la haine en ligne
Résumé

Le contenu haineux sur les réseaux sociaux ne cesse d’augmenter. Bien que Facebook, Twitter et Google aient entrepris plusieurs mesures pour lutter contre ce type de contenu, ces efforts risquent souvent de compromettre la liberté d’expression. À l’inverse, la contre-communication (counterspeech) constitue une approche efficace pour combattre la haine en ligne sans porter atteinte à la liberté d’expression. Par conséquent, une stratégie alternative pour ces plateformes pourrait consister à promouvoir la contre-communication comme moyen de résistance contre le contenu haineux. Toutefois, pour réussir à promouvoir efficacement cette forme de contre-communication, il est essentiel de comprendre en profondeur ses dynamiques dans l’espace numérique. L’absence de jeux de données soigneusement structurés constitue une entrave majeure à une telle compréhension. Dans cet article, nous proposons et mettons à disposition le premier jeu de données dédié à la contre-communication, extrait des commentaires YouTube. Ce jeu de données comprend 9 438 commentaires manuellement annotés, les étiquettes indiquant si un commentaire relève ou non de la contre-communication. Ce corpus permet d’effectuer une étude rigoureuse sur la structure linguistique de la contre-communication, pour la première fois dans la littérature. Cette analyse révèle plusieurs observations intéressantes : les commentaires de contre-communication reçoivent deux fois plus de « j’aime » que les commentaires non contre-communication ; dans certaines communautés, la majorité des commentaires non contre-communication sont des discours haineux ; les différents types de contre-communication ne sont pas tous également efficaces ; enfin, l’analyse psycholinguistique détaillée montre que le choix du langage des utilisateurs publiant des contre-communications diffère fortement de celui des utilisateurs publiant des commentaires non contre-communication. Enfin, nous avons développé une série de modèles d’apprentissage automatique capables de détecter automatiquement les contre-communications dans les vidéos YouTube avec un score F1 de 0,73.

Tu ne haïras point : Contre la haine en ligne | Articles de recherche récents | HyperAI