HyperAIHyperAI

مجموعة بيانات تقييم فهم لغة الفيديو VALUE

التاريخ

منذ 3 أعوام

المؤسسة

مايكروسوفت

رابط النشر

value-benchmark.github.io

رابط الورقة البحثية

arxiv.org

الترخيص

其他

مساعدة التنزيل
特色图像

VALUE تعني تقييم فهم الفيديو واللغة، وهي مجموعة بيانات لتقييم فهم الفيديو واللغة. مجموعة البيانات عبارة عن مجموعة من 11 مجموعة بيانات VidL (فيديو ولغة) يمكن استخدامها في 3 مهام شائعة: استرجاع النص إلى الفيديو؛ الإجابة على أسئلة الفيديو، وترجمة الفيديو. الهدف من VALUE هو تغطية مجموعة واسعة من أنواع الفيديو، وأطوال الفيديو، وكميات البيانات، ومستويات صعوبة المهام. لا تركز VALUE فقط على المعلومات المرئية للفيديو أحادي القناة، بل تعمل أيضًا على تعزيز النماذج التي تستخدم المعلومات من إطارات الفيديو والتسميات التوضيحية المرتبطة بها والنماذج التي تشارك المعرفة عبر مهام متعددة.

مجموعات البيانات المستخدمة لمعيار مجموعة بيانات VALUE هي:تلفزيون جودة التعليم ، TVR ، TVC ، How2R ، How2QA ، الكمان ، VLEP ، يوكوك2(YC2C، YC2R)، فاتكس

مجموعة بيانات تقييم فهم لغة الفيديو VALUE | مجموعات البيانات | HyperAI