日期
大小
机构
发布地址
linqs-data.soe.ucsc.edu
标签
分类
Social-Spammer-Heterogeneous 数据集是从名为 Tagged 的社交软件上收录的,它包含五百六十万的用户和八千五百万用户间的联系。数据集中的每个用户包含四个特征和一个手动输入用以鉴定是否为垃圾账号的标签分类。数据集中的每个联系则代表了两个用户间的互动,且包含一个时间戳和类别。网络中对于用户间的联系共含有七种匿名类别。该数据集最原始的任务就是基于关联与非关联的特征去鉴别垃圾账号