HyperAI

Ensemble De Données Microsoft News MIND

Date

il y a 9 mois

Taille

1.15 GB

Organisation

Microsoft
Université Tsinghua

URL de publication

msnews.github.io

Microsoft News Dataset (MIND) est un vaste ensemble de données pour la recherche de recommandations d'actualités, qui est collecté à partir de journaux de comportement anonymes du site Web Microsoft News. La mission de MIND est de servir d'ensemble de données de référence pour la recommandation d'actualités et de promouvoir la recherche dans le domaine de la recommandation d'actualités et des systèmes de recommandation.

MIND contient environ 160 000 articles d'actualité en anglais et plus de 15 millions de journaux d'impressions générés par 1 million d'utilisateurs. Chaque article d'actualité contient un contenu textuel riche, notamment un titre, un résumé, un corps, des catégories et des entités. Chaque journal d'impression contient les événements de clic de l'utilisateur, les événements sans clic et les comportements de clic d'actualité historiques avant cette impression. Pour protéger la confidentialité des utilisateurs, chaque utilisateur est découplé du système de production lorsqu'il est haché de manière sécurisée dans un identifiant anonyme.

Cet ensemble de données a été publié par Microsoft et l'Université Tsinghua en 2020. Le document pertinent est «MIND : un ensemble de données à grande échelle pour la recommandation d'actualités", sélectionné pour l'ACL 2020.

MIcrosoftNewsDataset-MIND.torrent
Partage 2Téléchargement 1Terminés 92Téléchargements totaux 150
  • MIcrosoftNewsDataset-MIND/
    • README.md
      1.54 KB
    • README.txt
      3.08 KB
      • data/
        • mind.zip
          1.15 GB