HyperAIHyperAI

Command Palette

Search for a command to run...

VidProM مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو

Discuss on Discord

Date

منذ 2 أعوام

Organization

جامعة تشجيانغ
Featured Image

مجموعة بيانات VidProM هي أول مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو للمستخدم الحقيقي، تم تطويرها بشكل مشترك من قبل جامعة سيدني للتكنولوجيا وجامعة تشجيانغ. ويحتوي على 1.67 مليون رسالة نصية فريدة لتحويل الفيديو إلى نص، و6.69 مليون مقطع فيديو تم إنشاؤها بواسطة أربعة نماذج انتشار متطورة.

لا توفر مجموعة البيانات كمية كبيرة من محتوى الفيديو فحسب، بل تتضمن أيضًا احتمالية NSFW (غير آمنة للعمل) المرتبطة بكل موجه، وتضمينات الموجه ذات الأبعاد 3072، والبيانات الوصفية الإضافية ذات الصلة. تتضمن عملية إنشائها جمع ملفات HTML المصدر، واستخراج الإشارات النصية وتضمينها، وتعيين احتمالات NSFW لها، والزحف إلى مقاطع الفيديو وتوليدها، وأخيرًا تصفية الإشارات الفريدة دلاليًا.

يهدف إصدار VidProM إلى تعزيز البحث في مجال إنشاء النص إلى الفيديو، وتغطية جوانب مثل تقييم النموذج، وإنشاء الفيديو بكفاءة، واكتشاف الفيديو المزيف، واكتشاف حقوق الطبع والنشر للفيديو، مما يوفر للباحثين موارد قيمة لاستكشاف وتطوير تقنيات جديدة لإنشاء النص إلى الفيديو.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp