HyperAI

مجموعة بيانات الاستدلال الحسي البصري لأجهزة تسجيل الفيديو

التاريخ

منذ 3 أعوام

الحجم

27.55 GB

المؤسسة

جامعة واشنطن

رابط النشر

visualcommonsense.com

الترخيص

其他

特色图像

VCR تعني Visual Commonsense Reasoning، وهي مجموعة بيانات واسعة النطاق للتفكير السليم البصري. تطرح مجموعة البيانات أسئلة صعبة حول الصور، وتحتاج الآلة إلى إكمال مهمتين فرعيتين: الإجابة على السؤال بشكل صحيح وتقديم أسباب لتبرير إجابتها.

تحتوي مجموعة بيانات VCR على عدد كبير من الأسئلة، منها 212 ألف سؤال تُستخدم للتدريب، و26 ألف سؤال للتحقق، و25 ألف سؤال للاختبار. الإجابات والأسباب تأتي من أكثر من 110 ألف مشهد سينمائي فريد.

VCR.torrent
البذر 1التنزيل 1مكتمل 76إجمالي التنزيلات 96
  • VCR/
    • README.md
      1.17 KB
    • README.txt
      2.34 KB
      • data/
        • vcr1annots.zip
          92.5 MB
        • vcr1images.zip
          27.55 GB