Command Palette
Search for a command to run...
مجموعة بيانات الإجابة على أسئلة الفيديو HowToVQA69M
التاريخ
الحجم
رابط النشر
رابط الورقة البحثية
الترخيص
أخرى

VQA تعني الإجابة المرئية على الأسئلة. HowToVQA69M عبارة عن مجموعة بيانات للإجابة على أسئلة الفيديو تحتوي على 69,270,581 سؤالاً وإجابة. حجمها ضعف حجم مجموعة بيانات الإجابة على أسئلة الفيديو الموجودة VideoQA.
في المتوسط، ينتج كل فيديو خام 43 مقطع فيديو، مدة كل منها 12.1 ثانية ومرتبطة بـ 1.2 سؤال وإجابة، حيث تحتوي الأسئلة على 8.7 كلمة والإجابات تحتوي على 2.4 كلمة. تُعد مجموعة بيانات HowToVQA69M شديدة التنوع، حيث تحتوي على أكثر من 16 مليون إجابة فريدة، منها أكثر من 2 مليون إجابة فريدة تظهر أكثر من مرة وأكثر من 300000 إجابة فريدة تظهر أكثر من 10 مرات.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.