
摘要
社交媒体中的仇恨内容正持续增长。尽管脸书(Facebook)、推特(Twitter)和谷歌(Google)已采取多项措施应对此类内容,但这些措施往往面临侵犯言论自由的风险。相比之下,反言(counterspeech)提供了一种在不损害言论自由的前提下有效应对网络仇恨内容的途径。因此,这些平台可考虑将推广反言作为抵御仇恨内容的一种替代策略。然而,要成功推广反言,必须深入理解其在在线环境中的传播机制。目前,由于缺乏精心构建的数据集,这一理解仍受到严重制约。本文首次基于YouTube评论构建并发布了专门用于反言研究的数据集。该数据集包含9438条人工标注的评论,标注内容明确标明每条评论是否属于反言。该数据集使我们能够首次开展严谨的测量研究,系统刻画反言的语义结构特征。分析结果揭示了若干有趣发现:反言评论所获得的点赞数是普通评论的两倍;在某些社群中,绝大多数非反言评论实质上属于仇恨言论;不同类型的反言在实际效果上并不均等;通过细致的心理语言学分析发现,发布反言的用户在语言选择上与发布非反言内容的用户存在显著差异。最后,我们构建了一套机器学习模型,能够在YouTube视频评论中自动识别反言,其F1得分达到0.73,展现出良好的检测性能。