HyperAI

مجموعة بيانات أخبار مايكروسوفت MIND

التاريخ

منذ 9 أشهر

الحجم

1.15 GB

المؤسسة

مايكروسوفت
جامعة تسينغهوا

رابط النشر

msnews.github.io

العلامات

مجموعة بيانات أخبار Microsoft (MIND) عبارة عن مجموعة بيانات كبيرة لأبحاث توصيات الأخبار، والتي يتم جمعها من سجلات السلوك المجهولة لموقع Microsoft News على الويب. تتمثل مهمة MIND في العمل كمجموعة بيانات مرجعية لتوصيات الأخبار وتعزيز البحث في مجال توصية الأخبار وأنظمة التوصية.

يحتوي MIND على ما يقرب من 160,000 مقالة إخبارية باللغة الإنجليزية وأكثر من 15 مليون سجل انطباع تم إنشاؤها بواسطة مليون مستخدم. تحتوي كل مقالة إخبارية على محتوى نصي غني، بما في ذلك العنوان والملخص والنص والفئات والكيانات. يحتوي كل سجل ظهور على أحداث النقر للمستخدم، والأحداث غير المتعلقة بالنقر، وسلوكيات النقر الإخبارية التاريخية قبل هذا الظهور. لحماية خصوصية المستخدم، يتم فصل كل مستخدم عن نظام الإنتاج عند تجزئته بشكل آمن إلى معرف مجهول.

تم إصدار مجموعة البيانات هذه بواسطة Microsoft وجامعة تسينغهوا في عام 2020. الورقة ذات الصلة هي "MIND: مجموعة بيانات واسعة النطاق لتوصيات الأخبار"، تم اختياره لـ ACL 2020.

MIcrosoftNewsDataset-MIND.torrent
البذر 2التنزيل 1مكتمل 92إجمالي التنزيلات 150
  • MIcrosoftNewsDataset-MIND/
    • README.md
      1.54 KB
    • README.txt
      3.08 KB
      • data/
        • mind.zip
          1.15 GB