HyperAI초신경

MIND Microsoft 뉴스 데이터 세트

날짜

9달 전

크기

1.15 GB

기관

마이크로소프트
칭화대학교

발행 주소

msnews.github.io

태그

카테고리

MIcrosoft News Dataset(MIND)은 Microsoft News 웹사이트의 익명 동작 로그에서 수집된 뉴스 추천 연구를 위한 대규모 데이터 세트입니다. MIND의 사명은 뉴스 추천을 위한 벤치마크 데이터 세트 역할을 하고 뉴스 추천 및 추천 시스템 분야의 연구를 촉진하는 것입니다.

MIND에는 약 16만 건의 영어 뉴스 기사와 100만 명의 사용자가 생성한 1,500만 건 이상의 인상 로그가 포함되어 있습니다. 각 뉴스 기사에는 제목, 요약, 본문, 범주, 엔터티를 포함한 풍부한 텍스트 콘텐츠가 포함되어 있습니다. 각 노출 로그에는 이 노출 이전의 사용자 클릭 이벤트, 비클릭 이벤트, 이전 뉴스 클릭 동작이 포함됩니다. 사용자의 개인 정보를 보호하기 위해 각 사용자는 익명 ID로 안전하게 해시되어 프로덕션 시스템에서 분리됩니다.

이 데이터 세트는 2020년 Microsoft와 Tsinghua University에서 공개되었습니다. 관련 논문은 "MIND: 뉴스 추천을 위한 대규모 데이터 세트", ACL 2020에 선정됨.

MIcrosoftNewsDataset-MIND.torrent
시딩 1다운로드 중 1완료됨 92총 다운로드 횟수 150
  • MIcrosoftNewsDataset-MIND/
    • README.md
      1.54 KB
    • README.txt
      3.08 KB
      • data/
        • mind.zip
          1.15 GB