HyperAI

مجموعة بيانات فهم القراءة الآلية MSMARCO

التاريخ

منذ 6 أعوام

الحجم

259.55 MB

المؤسسة

مايكروسوفت

رابط النشر

www.msmarco.org

MSMARCO عبارة عن مجموعة بيانات لفهم القراءة الآلية تحتوي على 1,010,916 سؤالاً مجهولاً من سجلات استعلامات البحث الخاصة بـ Bing، والتي تحتوي على إجابات تم إنشاؤها بواسطة الذكاء الاصطناعي و182,669 إجابة أعيد كتابتها بواسطة الإنسان. تحتوي مجموعة البيانات أيضًا على 8,841,823 فقرة مستخرجة من 3,563,535 مستندًا.

تم إصدار مجموعة بيانات MSMARCO بواسطة Microsoft في عام 2016 وتم تحديثها في عام 2018. بالإضافة إلى ذلك، تحتوي مجموعة البيانات على منافسة تصنيف مقابلة.

السيدة ماركو.torrent
البذر 3التنزيل 0مكتمل 1,150إجمالي التنزيلات 1,449
  • MSMARCO/
    • README.md
      1.03 KB
    • README.txt
      2.06 KB
      • data/
        • dev_v2.1.json.gz
          131.9 MB
        • eval_v2.1_public.json.gz
          259.55 MB