MIND Microsoft ニュース データセット

日期

6 个月前

大小

1.15 GB

机构

マイクロソフト
清華大学

发布地址

msnews.github.io

MIcrosoft News Dataset (MIND) は、Microsoft News Web サイトの匿名の行動ログから収集された、ニュース推奨調査のための大規模なデータセットです。 MIND の使命は、ニュース推奨のベンチマーク データセットとして機能し、ニュース推奨および推奨システムの分野の研究を促進することです。

MIND には、約 16 万件の英語ニュース記事と、100 万人のユーザーによって生成された 1,500 万件を超えるインプレッション ログが含まれています。各ニュース記事には、タイトル、要約、本文、カテゴリ、エンティティなどのリッチ テキスト コンテンツが含まれています。各インプレッション ログには、クリック イベント、非クリック イベント、およびこのインプレッション以前のこのユーザーのニュース クリック動作の履歴が含まれます。ユーザーのプライバシーを保護するために、匿名 ID に安全にハッシュされると、各ユーザーは実稼働システムから切り離されます。

このデータセットは 2020 年に Microsoft と清華大学によってリリースされ、関連する論文は「MIND: ニュースレコメンデーションのための大規模データセット』でACL2020に選出されました。

MIcrosoftNewsDataset-MIND.torrent

做种 1

下载中 0

已完成 57

总下载 109

  • MIcrosoftNewsDataset-MIND/
    • README.md
      1.54 KB
    • README.txt
      3.08 KB
      • data/
        • mind.zip
          1.15 GB