Annotieren von Online-Misogynie

Online-Misogynie, eine Kategorie von online verbreiteter missbräuchlicher Sprache, hat gravierende und schädliche gesellschaftliche Folgen. Die automatische Erkennung misogyner Sprache im Internet ist zwar unerlässlich, stellt jedoch aufgrund der sprachlichen Komplexität und Vielfalt dieser Daten erhebliche Herausforderungen bei der Datensammlung, Datenauszeichnung und Bias-Minderung dar. In diesem Artikel leisten wir drei Beiträge auf diesem Gebiet: Erstens beschreiben wir die detaillierte Gestaltung unseres iterativen Auszeichnungsprozesses und des Codebooks. Zweitens präsentieren wir eine umfassende Taxonomie von Etiketten zur Annotation von Misogynie in natürlicher schriftlicher Sprache. Drittens stellen wir eine hochwertige Datensammlung annotierter Beiträge vor, die aus sozialen Medien-Posts stammen.