مجموعة بيانات تحرير الفيديو Ditto-1M الموجهة بالتعليمات
Date
Paper URL
License
Non-Commercial
Ditto-1M هي مجموعة بيانات لتحرير الفيديو تعتمد على الأوامر، صدرت عام ٢٠٢٥ من قِبل جامعة هونغ كونغ للعلوم والتكنولوجيا، ومجموعة Ant، وجامعة تشجيانغ، ومؤسسات أخرى. نتائج البحث ذات الصلة هي:توسيع نطاق تحرير الفيديو القائم على التعليمات باستخدام مجموعة بيانات تركيبية عالية الجودة"، والذي يهدف إلى تعزيز تطوير نماذج تحرير الفيديو استنادًا إلى تعليمات اللغة الطبيعية، وتحسين فهم النموذج للتعليمات المعقدة ودقة إنشاء الفيديو من خلال عينات تركيبية عالية الجودة وواسعة النطاق.
تحتوي هذه المجموعة من البيانات على ما يقارب مليون ملف ثلاثي لتحرير الفيديو عالي الدقة، يتكون كل منها من فيديو مصدر، وتعليمات تحرير، والفيديو المُحرَّر. يبلغ متوسط عدد إطارات كل فيديو 101 إطار، ودقة عرضه 1280×720. تُقسَّم مهام التحرير إلى ثلاث فئات:
- نقل الأسلوب العالمي: بما في ذلك تغييرات الأسلوب الفني، وتصنيف الألوان، والمؤثرات البصرية، وما إلى ذلك.
- التحرير الحر العالمي: بما في ذلك تعديلات المشهد المعقد، والتغييرات البيئية، والتحولات الإبداعية، وما إلى ذلك.
- التحرير المحلي: يتضمن تعديل الكائن الدقيق، وتغييرات السمات، والتعديلات المحلية، وما إلى ذلك.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.