
摘要
协同回复攻击是一种在在线影响力操作及其他协同行动中观察到的策略,旨在支持或针对特定个体进行骚扰,或影响其本人及其追随者。尽管此类攻击具有影响公众舆论的潜力,但以往研究尚未对其开展系统分析,也未提出有效的检测方法。本研究聚焦于推特(Twitter)平台上的影响力操作情境,对协同回复攻击行为进行了特征刻画。分析结果表明,此类攻击的主要目标为具有影响力的个体,包括记者、新闻媒体、政府官员及政治人物。本文提出两种监督式机器学习模型:其一用于分类推文,判断其是否遭受回复攻击;其二用于分类回复特定推文的账户,判断其是否属于协同攻击的一部分。两个分类器的AUC得分分别达到0.88和0.97。结果表明,参与回复攻击的账户可被有效识别,同时,被攻击的目标账户本身也可作为检测影响力操作的潜在“传感器”。