HyperAIHyperAI

Command Palette

Search for a command to run...

MIND 微软新闻数据集

Date

1 年前

Size

1.15 GB

Organization

Microsoft
清华大学

Publish URL

msnews.github.io

MIcrosoft News Dataset (MIND) 是一个用于新闻推荐研究的大型数据集, 它收集自 Microsoft News 网站的匿名行为日志。 MIND 的使命是作为新闻推荐的基准数据集,并促进新闻推荐和推荐系统领域的研究。

MIND 包含约 16 万篇英文新闻文章和 100 万用户生成的超过 1500 万条印象日志。每篇新闻文章都包含丰富的文本内容,包括标题、摘要、正文、类别和实体。每条印象日志都包含此用户在此次印象之前的点击事件、未点击事件和历史新闻点击行为。为了保护用户隐私,每个用户在被安全哈希为匿名 ID 时都会与生产系统脱钩。

该数据集是由微软和清华大学于 2020 年发布,相关论文为「MIND: A Large-scale Dataset for News Recommendation」,入选 ACL 2020 。

MIcrosoftNewsDataset-MIND.torrent
Seeding 1Downloading 0Completed 215Total Downloads 387
  • MIcrosoftNewsDataset-MIND/
    • README.md
      1.54 KB
    • README.txt
      3.08 KB
      • data/
        • mind.zip
          1.15 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供