HyperAI

TriviaQA مجموعة بيانات كبيرة لفهم القراءة والإجابة على الأسئلة

التاريخ

منذ عام واحد

الحجم

3.07 GB

المؤسسة

معهد ألين للذكاء الاصطناعي

رابط النشر

nlp.cs.washington.edu

TriviaQA عبارة عن مجموعة بيانات لفهم القراءة تحتوي على أكثر من 650,000 ثلاثية من الأسئلة والأجوبة. يتضمن TriviaQA 950 ألف زوج من الأسئلة والأجوبة من 662 ألف مستند من ويكيبيديا والويب. تُعد مجموعة البيانات هذه أكثر تحديًا من معايير ضمان الجودة القياسية مثل مجموعة بيانات ستانفورد للإجابة على الأسئلة (SQuAD) لأن إجابة السؤال قد لا يتم الحصول عليها بشكل مباشر من خلال التنبؤ بالمدى والسياق طويل. تتكون مجموعة بيانات TriviaQA من مجموعات فرعية من ضمان الجودة تم التحقق منها بواسطة الإنسان وأخرى تم إنشاؤها بواسطة الآلة. يمكن العثور على التفاصيل في ورقة ACL 17 "TriviaQA: مجموعة بيانات واسعة النطاق لتحدي الإشراف عن بُعد لفهم القراءة"

TriviaQA.torrent
البذر 1التنزيل 1مكتمل 80إجمالي التنزيلات 163
  • TriviaQA/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • TQA.zip
          3.07 GB