التاريخ

منذ 2 أعوام

المؤسسة

الوسوم

مجموعة بيانات VidProM هي أول مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو للمستخدم الحقيقي، تم تطويرها بشكل مشترك من قبل جامعة سيدني للتكنولوجيا وجامعة تشجيانغ. ويحتوي على 1.67 مليون رسالة نصية فريدة لتحويل الفيديو إلى نص، و6.69 مليون مقطع فيديو تم إنشاؤها بواسطة أربعة نماذج انتشار متطورة. لا توفر مجموعة البيانات كمية كبيرة من محتوى الفيديو فحسب، بل تتضمن أيضًا احتمالية NSFW (غير آمنة للعمل) المرتبطة بكل موجه، وتضمينات الموجه ذات الأبعاد 3072، والبيانات الوصفية الإضافية ذات الصلة. تتضمن عملية إنشائها جمع ملفات HTML المصدر، واستخراج الإشارات النصية وتضمينها، وتعيين احتمالات NSFW لها، والزحف إلى مقاطع الفيديو وتوليدها، وأخيرًا تصفية الإشارات الفريدة دلاليًا. يهدف إصدار VidProM إلى تعزيز البحث في مجال إنشاء النص إلى الفيديو، وتغطية جوانب مثل تقييم النموذج، وإنشاء الفيديو بكفاءة، واكتشاف الفيديو المزيف، واكتشاف حقوق الطبع والنشر للفيديو، مما يوفر للباحثين موارد قيمة لاستكشاف وتطوير تقنيات جديدة لإنشاء النص إلى الفيديو.

الاستشهاد

@article{wang2024vidprom, العنوان={VidProM: مجموعة بيانات حقيقية لمعرض الرسائل النصية بحجم مليون مستخدم لنماذج نشر النصوص إلى الفيديو}, المؤلف={وانغ، وينهاو ويانغ، يي}، عنوان الكتاب: {المؤتمر الثامن والثلاثون حول أنظمة معالجة المعلومات العصبية} year={2024}, url={https://openreview.net/forum?id=pYNl76onJL} }

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

ناقش على Discord

التاريخ

منذ 2 أعوام

المؤسسة

الوسوم

نص إلى فيديو

تصنيف الصور

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

منذ 7 أيام

مجموعة بيانات تلوث الهواء ومؤشر جودة الهواء في العالم

منذ شهر واحد

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

منذ شهر واحد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

VidProM مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو

الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VidProM مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

مجموعة بيانات تلوث الهواء ومؤشر جودة الهواء في العالم

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VidProM مجموعة بيانات واسعة النطاق لتحويل النص إلى فيديو

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

مجموعة بيانات تلوث الهواء ومؤشر جودة الهواء في العالم

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

مجموعة بيانات تلوث الهواء ومؤشر جودة الهواء في العالم

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعات البيانات ذات الصلة

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

مجموعة بيانات تلوث الهواء ومؤشر جودة الهواء في العالم

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات