Annotation de la misogynie en ligne

La misogynie en ligne, une forme de langage abusif sur Internet, a des conséquences sociales graves et néfastes. La détection automatique de ce type de langage, bien qu’impérative, soulève des défis complexes en matière de collecte de données, d’annotation et de mitigation des biais, en raison de la complexité linguistique et de la diversité intrinsèque de ces données. Ce papier apporte trois contributions dans ce domaine : premièrement, nous décrivons en détail la conception de notre processus d’annotation itératif ainsi que de son codebook ; deuxièmement, nous proposons une taxonomie complète des étiquettes destinées à l’annotation de la misogynie dans le langage écrit naturel ; enfin, nous introduisons un jeu de données de haute qualité comprenant des messages annotés extraits de publications sur les réseaux sociaux.