مجموعة بيانات تقييم فهم لغة الفيديو VALUE
التاريخ
رابط النشر
الترخيص
其他
الفئات

VALUE تعني تقييم فهم الفيديو واللغة، وهي مجموعة بيانات لتقييم فهم الفيديو واللغة. مجموعة البيانات عبارة عن مجموعة من 11 مجموعة بيانات VidL (فيديو ولغة) يمكن استخدامها في 3 مهام شائعة: استرجاع النص إلى الفيديو؛ الإجابة على أسئلة الفيديو، وترجمة الفيديو. الهدف من VALUE هو تغطية مجموعة واسعة من أنواع الفيديو، وأطوال الفيديو، وكميات البيانات، ومستويات صعوبة المهام. لا تركز VALUE فقط على المعلومات المرئية للفيديو أحادي القناة، بل تعمل أيضًا على تعزيز النماذج التي تستخدم المعلومات من إطارات الفيديو والتسميات التوضيحية المرتبطة بها والنماذج التي تشارك المعرفة عبر مهام متعددة.
مجموعات البيانات المستخدمة لمعيار مجموعة بيانات VALUE هي:تلفزيون جودة التعليم ، TVR ، TVC ، How2R ، How2QA ، الكمان ، VLEP ، يوكوك2(YC2C، YC2R)، فاتكس