MIcrosoft News Dataset (MIND) 是一个用于新闻推荐研究的大型数据集, 它收集自 Microsoft News 网站的匿名行为日志。 MIND 的使命是作为新闻推荐的基准数据集,并促进新闻推荐和推荐系统领域的研究。
MIND 包含约 16 万篇英文新闻文章和 100 万用户生成的超过 1500 万条印象日志。每篇新闻文章都包含丰富的文本内容,包括标题、摘要、正文、类别和实体。每条印象日志都包含此用户在此次印象之前的点击事件、未点击事件和历史新闻点击行为。为了保护用户隐私,每个用户在被安全哈希为匿名 ID 时都会与生产系统脱钩。
该数据集是由微软和清华大学于 2020 年发布,相关论文为「MIND: A Large-scale Dataset for News Recommendation」,入选 ACL 2020 。
做种 1
下载中 0
已完成 23
总下载 57