HyperAIHyperAI

Command Palette

Search for a command to run...

VidProM مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو

التاريخ

منذ 2 أعوام

المؤسسة

جامعة تشجيانغ
انضم إلى مجتمع Discord
Featured Image

مجموعة بيانات VidProM هي أول مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو للمستخدم الحقيقي، تم تطويرها بشكل مشترك من قبل جامعة سيدني للتكنولوجيا وجامعة تشجيانغ. ويحتوي على 1.67 مليون رسالة نصية فريدة لتحويل الفيديو إلى نص، و6.69 مليون مقطع فيديو تم إنشاؤها بواسطة أربعة نماذج انتشار متطورة.

لا توفر مجموعة البيانات كمية كبيرة من محتوى الفيديو فحسب، بل تتضمن أيضًا احتمالية NSFW (غير آمنة للعمل) المرتبطة بكل موجه، وتضمينات الموجه ذات الأبعاد 3072، والبيانات الوصفية الإضافية ذات الصلة. تتضمن عملية إنشائها جمع ملفات HTML المصدر، واستخراج الإشارات النصية وتضمينها، وتعيين احتمالات NSFW لها، والزحف إلى مقاطع الفيديو وتوليدها، وأخيرًا تصفية الإشارات الفريدة دلاليًا.

يهدف إصدار VidProM إلى تعزيز البحث في مجال إنشاء النص إلى الفيديو، وتغطية جوانب مثل تقييم النموذج، وإنشاء الفيديو بكفاءة، واكتشاف الفيديو المزيف، واكتشاف حقوق الطبع والنشر للفيديو، مما يوفر للباحثين موارد قيمة لاستكشاف وتطوير تقنيات جديدة لإنشاء النص إلى الفيديو.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
VidProM مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو | مجموعات البيانات | HyperAI