12 天前

标注在线性别歧视

{Leon Derczynski, Nanna Inie, Philine Zeinert}
标注在线性别歧视
摘要

网络性别歧视(online misogyny)作为一种网络暴力语言的类别,具有严重的社会危害性。对网络中的性别歧视语言进行自动检测虽属迫切需求,但在数据收集、数据标注以及偏见缓解等方面均面临复杂挑战,原因在于此类语言在语言特征上具有高度的复杂性与多样性。本文在该领域作出三项贡献:首先,详细阐述了我们迭代式标注流程与标注手册(codebook)的设计过程;其次,提出了一套全面的标签分类体系,用于对自然书面语言中的性别歧视内容进行标注;最后,构建了一个高质量的标注数据集,其中的文本样本均来自社交媒体帖子的抽样数据。

标注在线性别歧视 | 最新论文 | HyperAI超神经