HyperAI

مجموعة بيانات تقييم فهم لغة الفيديو VALUE

التاريخ

منذ 3 أعوام

المؤسسة

مايكروسوفت

رابط النشر

value-benchmark.github.io

الترخيص

其他

مساعدة التنزيل
特色图像

VALUE تعني تقييم فهم الفيديو واللغة، وهي مجموعة بيانات لتقييم فهم الفيديو واللغة. مجموعة البيانات عبارة عن مجموعة من 11 مجموعة بيانات VidL (فيديو ولغة) يمكن استخدامها في 3 مهام شائعة: استرجاع النص إلى الفيديو؛ الإجابة على أسئلة الفيديو، وترجمة الفيديو. الهدف من VALUE هو تغطية مجموعة واسعة من أنواع الفيديو، وأطوال الفيديو، وكميات البيانات، ومستويات صعوبة المهام. لا تركز VALUE فقط على المعلومات المرئية للفيديو أحادي القناة، بل تعمل أيضًا على تعزيز النماذج التي تستخدم المعلومات من إطارات الفيديو والتسميات التوضيحية المرتبطة بها والنماذج التي تشارك المعرفة عبر مهام متعددة.

مجموعات البيانات المستخدمة لمعيار مجموعة بيانات VALUE هي:تلفزيون جودة التعليم ، TVR ، TVC ، How2R ، How2QA ، الكمان ، VLEP ، يوكوك2(YC2C، YC2R)، فاتكس