HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الإجابة على أسئلة الفيديو HowToVQA69M

التاريخ

منذ 3 أعوام

الحجم

7.88 GB

المؤسسة

رابط النشر

antoyang.github.io

رابط الورقة البحثية

arxiv.org

الترخيص

أخرى

Featured Image

VQA تعني الإجابة المرئية على الأسئلة. HowToVQA69M عبارة عن مجموعة بيانات للإجابة على أسئلة الفيديو تحتوي على 69,270,581 سؤالاً وإجابة. حجمها ضعف حجم مجموعة بيانات الإجابة على أسئلة الفيديو الموجودة VideoQA.

في المتوسط، ينتج كل فيديو خام 43 مقطع فيديو، مدة كل منها 12.1 ثانية ومرتبطة بـ 1.2 سؤال وإجابة، حيث تحتوي الأسئلة على 8.7 كلمة والإجابات تحتوي على 2.4 كلمة. تُعد مجموعة بيانات HowToVQA69M شديدة التنوع، حيث تحتوي على أكثر من 16 مليون إجابة فريدة، منها أكثر من 2 مليون إجابة فريدة تظهر أكثر من مرة وأكثر من 300000 إجابة فريدة تظهر أكثر من 10 مرات.

HowToVQA69M.torrent
البذر 2التنزيل 0مكتمل 653إجمالي التنزيلات 554
  • HowToVQA69M/
    • README.md
      1.23 KB
    • README.txt
      2.47 KB
      • data/
        • ReadMe.txt
          3.38 KB
        • howtovqa.pkl
          5.98 GB
        • train_howtovqa.csv
          6.02 GB
        • val_howtovqa.csv
          6.02 GB
          • vedio/
            • HowTo100M.zip
              7.88 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp