HyperAI

مجموعة بيانات فهم القراءة الآلية MSMARCO

التاريخ

منذ 6 أعوام

الحجم

259.55 MB

المؤسسة

مايكروسوفت

رابط النشر

www.msmarco.org

MSMARCO عبارة عن مجموعة بيانات لفهم القراءة الآلية تحتوي على 1,010,916 سؤالاً مجهولاً من سجلات استعلامات البحث الخاصة بـ Bing، والتي تحتوي على إجابات تم إنشاؤها بواسطة الذكاء الاصطناعي و182,669 إجابة أعيد كتابتها بواسطة الإنسان. تحتوي مجموعة البيانات أيضًا على 8,841,823 فقرة مستخرجة من 3,563,535 مستندًا.

تم إصدار مجموعة بيانات MSMARCO بواسطة Microsoft في عام 2016 وتم تحديثها في عام 2018. بالإضافة إلى ذلك، تحتوي مجموعة البيانات على منافسة تصنيف مقابلة.

MSMARCO.torrent
البذر 2التنزيل 0مكتمل 1,038إجمالي التنزيلات 1,418
  • MSMARCO/
    • README.md
      1.03 KB
    • README.txt
      2.06 KB
      • data/
        • dev_v2.1.json.gz
          131.9 MB
        • eval_v2.1_public.json.gz
          259.55 MB