مجموعة بيانات استنساخ الكاميرا متعددة العرض
التاريخ
رابط الورقة البحثية
الترخيص
Apache 2.0
كاميرا كلون، التي أصدرتها جامعة هونغ كونغ بالتعاون مع جامعة تشجيانغ، وتكنولوجيا كوايشو، ومؤسسات أخرى في عام 2025، هي مجموعة بيانات فيديو اصطناعية واسعة النطاق تم تقديمها باستخدام محرك Unreal Engine 5. عنوان ورقة البحث ذات الصلة هو "...".CamCloneMaster: تمكين التحكم في الكاميرا المستند إلى المرجع لإنشاء الفيديوالهدف هو دعم تعلم استنساخ الكاميرا، والذي يكرر حركة الكاميرا في مقطع فيديو مرجعي مع الحفاظ على محتوى المشهد دون تغيير، وبالتالي تحقيق "إعادة إنتاج المحتوى + مطابقة حركة الكاميرا".
تحتوي هذه المجموعة على 391,000 فيديو، تغطي 39,100 موقع تصوير ديناميكي، التقطت كل منها 10 كاميرات في وقت واحد. بناءً على هذه التركيبات من وجهات النظر، تتألف مجموعة البيانات من 1,154,819 مجموعة ثلاثية، تتكون من فيديو مرجعي لحركة الكاميرا، وفيديو مرجعي للمحتوى، وفيديو هدف يُعيد إنتاج مسار الكاميرا نفسه.
نظرة عامة على ميزات مجموعة البيانات:
- بيئة التوليد: تم إنشاء كافة مقاطع الفيديو في 40 مشهدًا ثلاثي الأبعاد عالي الجودة.
- الشخصيات والإجراءات: تتضمن 66 شخصية و93 إجراءً من Fab و Mixamo.
- مسار الكاميرا: يتم استخدام أنواع متعددة من مسارات الكاميرا التي يتم إنشاؤها تلقائيًا، ويتم إعادة استخدام نفس المسار في مواقع مختلفة لإنشاء أزواج من المسارات.
- إعداد الكاميرا: يتم نشر 10 كاميرات متزامنة في كل موقع تصوير لالتقاط بيانات متعددة المشاهد.
- مواصفات الفيديو: يبلغ الطول 77 إطارًا في الثانية و15 إطارًا في الثانية بشكل موحد؛ والدقة 1344×768 أو 1008×576، ويمكن تكييف النماذج التوليدية المختلفة عن طريق اقتصاص المركز.
- تنظيم الملفات: يتم تنظيم البيانات حسب التاريخ ورقم المسار، حيث يحتوي كل مجلد مسار على جميع مقاطع الفيديو الخاصة بوجهة النظر المقابلة لهذا المسار.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.