التاريخ

منذ 4 أعوام

المؤسسة

عنوان URL للنشر

value-benchmark.github.io

رابط الورقة البحثية

arxiv.org

الترخيص

Other

الوسوم

متعدد الوسائط

فهم الفيديو

الإجابة على الأسئلة البصرية

VALUE تعني تقييم فهم الفيديو واللغة، وهي مجموعة بيانات لتقييم فهم الفيديو واللغة. مجموعة البيانات عبارة عن مجموعة من 11 مجموعة بيانات VidL (فيديو ولغة) يمكن استخدامها في 3 مهام شائعة: استرجاع النص إلى الفيديو؛ الإجابة على أسئلة الفيديو، وترجمة الفيديو. الهدف من VALUE هو تغطية مجموعة واسعة من أنواع الفيديو، وأطوال الفيديو، وكميات البيانات، ومستويات صعوبة المهام. لا تركز VALUE فقط على المعلومات المرئية للفيديو أحادي القناة، بل تعمل أيضًا على تعزيز النماذج التي تستخدم المعلومات من إطارات الفيديو والتسميات التوضيحية المرتبطة بها والنماذج التي تشارك المعرفة عبر مهام متعددة. مجموعات البيانات المستخدمة لمعيار مجموعة بيانات VALUE هي:تلفزيون جودة التعليم ، TVR ، TVC ، How2R ، How2QA ، الكمان ، VLEP ، يوكوك2(YC2C، YC2R)، فاتكس

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار