مجموعة بيانات ترجمة الفيديو MSR-VTT
التاريخ
الحجم
رابط النشر
رابط الورقة البحثية
الترخيص
أخرى
العلامات

MSR-VTT، الاسم الكامل لـ Microsoft Research Video to Text، عبارة عن مجموعة بيانات ترجمة فيديو واسعة النطاق للمجالات المفتوحة.
تتكون مجموعة البيانات من 10000 مقطع فيديو من 20 فئة، كل منها يحتوي على 20 جملة باللغة الإنجليزية موضحة بواسطة Amazon Mechanical Turks. يوجد ما يقارب 29000 كلمة مختلفة في كافة الترجمات. تستخدم التجزئة القياسية 6,513 مقطعًا للتدريب، و497 مقطعًا للتحقق، و2,990 مقطعًا للاختبار.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.