18 天前

利用数字DNA压缩检测社交媒体中的机器人行为

{Conor Hayes, Nivranshu Pasricha}
摘要

近年来,Facebook、Twitter等在线社交网络面临的一个重大挑战是虚假账号和自动化机器人账号数量的显著增长。部分此类账号已被证实从事垃圾信息传播、政治宣传以及在平台上散布虚假信息等不良行为。本文提出一种检测Twitter账号中机器人行为的方法,通过分析其历史发帖活动实现。该方法基于一种现有的Twitter账号分析技术——数字DNA(Digital DNA)。数字DNA将用户账号的发帖历史编码为类似于实际DNA序列的字符序列,从而建模账号的行为特征。在本研究中,我们对这些数字DNA序列应用无损压缩算法,并利用压缩统计结果作为衡量一组Twitter账号行为可预测性的指标。进一步地,我们利用压缩统计信息生成一个简单的二维散点图,以直观呈现用户的发帖行为模式。最后,通过调用现成的逻辑回归分类算法实现对用户账号的分类,将其区分为机器人账号与真实用户账号。