HyperAI

مجموعة بيانات فيديو مشروع Open Sora Dataset

التاريخ

منذ عام واحد

المؤسسة

رابط النشر

huggingface.co

مساعدة التنزيل
特色图像

Open-Sora-Plan هو مشروع مفتوح المصدر يهدف إلى إعادة إنتاج Sora (نموذج T2V) الخاص بـ OpenAI وبناء المعرفة حول Video-VQVAE (VideoGPT) + DiT. تم إطلاق هذا المشروع بشكل مشترك بين جامعة بكين وشركة Tuzhan Intelligence، وقد ساهم البحث بشكل كبير في تعزيز جودة إنشاء الفيديو والقدرة على التحكم في النص. يتمتع هذا الطراز بالقدرة على إنشاء مقاطع فيديو عالية الدقة 1024×1024 مدتها 10 ثوانٍ و24 إطارًا في الثانية، كما يدعم أيضًا إنشاء صور عالية الدقة، مما يوفر للمستخدمين تجربة بصرية أكثر ثراءً وتفصيلاً.

تعتبر هذه المجموعة من البيانات عبارة عن مجموعة بيانات فيديو لمشروعها. قام فريق البحث بفحص 40,258 مقطع فيديو من مواقع ويب مفتوحة المصدر بموجب ترخيص CC0. جميع مقاطع الفيديو عالية الجودة ولا تحتوي على علامة مائية، ومنها حوالي 60% هي بيانات أفقية. المدة الإجمالية هي تقريبًا 274س 05د 13ث .

تنقسم المصادر الرئيسية للبيانات إلى ثلاثة أجزاء:

  1. مجموعة متنوعة:إجمالي عدد مقاطع الفيديو التي جمعها فريق البحث هو 1,234، المدة الإجمالية حوالي 6 ساعات و 19 دقيقة و 32 ثانية، العدد الإجمالي للإطارات هو 570,815 .
  2. بيكسلز:العدد الإجمالي للفيديوهات التي جمعها فريق البحث هو 7,408,المدة الإجمالية هي تقريبًا 48 ساعة 49 دقيقة 24 ثانية، العدد الإجمالي للإطارات هو 5,038,641 .
  3. بيكساباي:العدد الإجمالي للفيديوهات التي جمعها فريق البحث هو 31,616,المدة الإجمالية هي تقريبًا 218س 56د 17ث، العدد الإجمالي للإطارات هو 23,508,970 .