MIND 微软新闻数据集

日期

3 个月前

大小

1.15 GB

机构

Microsoft
清华大学

发布地址

msnews.github.io

标签

MIcrosoft News Dataset (MIND) 是一个用于新闻推荐研究的大型数据集, 它收集自 Microsoft News 网站的匿名行为日志。 MIND 的使命是作为新闻推荐的基准数据集,并促进新闻推荐和推荐系统领域的研究。

MIND 包含约 16 万篇英文新闻文章和 100 万用户生成的超过 1500 万条印象日志。每篇新闻文章都包含丰富的文本内容,包括标题、摘要、正文、类别和实体。每条印象日志都包含此用户在此次印象之前的点击事件、未点击事件和历史新闻点击行为。为了保护用户隐私,每个用户在被安全哈希为匿名 ID 时都会与生产系统脱钩。

该数据集是由微软和清华大学于 2020 年发布,相关论文为「MIND: A Large-scale Dataset for News Recommendation」,入选 ACL 2020 。

MIcrosoftNewsDataset-MIND.torrent

做种 1

下载中 0

已完成 23

总下载 57

  • MIcrosoftNewsDataset-MIND/
    • README.md
      1.54 KB
    • README.txt
      3.08 KB
      • data/
        • mind.zip
          1.15 GB