MiraData: مجموعة بيانات فيديو واسعة النطاق ذات مدة طويلة وتعليقات توضيحية منظمة
التاريخ
الحجم
رابط النشر
العلامات
* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.
MiraData هي مجموعة بيانات فيديو كبيرة تم تطويرها بشكل مشترك من قبل مختبر Tencent PCG ARC والجامعة الصينية في هونج كونج في عام 2024. وهي مصممة لمهام إنشاء مقاطع فيديو طويلة. نتائج الورقة هي "MiraData: مجموعة بيانات فيديو واسعة النطاق ذات فترات زمنية طويلة وترجمات منظمة"
على عكس مقاطع الفيديو القصيرة السابقة، يركز MiraData على مقاطع الفيديو غير المحررة التي تتراوح مدتها بين دقيقة إلى دقيقتين (متوسط المدة 72.1 ثانية). يأتي كل فيديو مصحوبًا بوصف منظم من زوايا مختلفة، بمتوسط طول وصف يبلغ 318 كلمة، مما يضمن عرضًا شاملاً لمحتوى الفيديو. ويحتوي على ستة أنواع من الأوصاف: وصف الموضوع، والخلفية، والأسلوب، وحركة الكاميرا، والوصف القصير، والوصف المكثف، مما يعزز عمق وصف مجموعة البيانات.
ولضمان جودة المقاطع، قام فريق البحث بتصفية مجموعة البيانات إلى خمس مجموعات فرعية بناءً على الجماليات وكثافة الحركة واللون، واختيار المقاطع ذات الجودة البصرية العالية وكثافة الحركة القوية. وللحصول على أوصاف مفصلة ودقيقة، قام فريق البحث أولاً بإنشاء ترجمات قصيرة باستخدام مولد ترجمة متطور، ثم إثرائها باستخدام GPT-4V لإنشاء ترجمات كثيفة. لتوفير وصف فيديو دقيق من وجهات نظر متعددة.
توفر مجموعة بيانات MiraData موارد قيمة وتحديات جديدة للباحثين في مجالات إنشاء مقاطع الفيديو الطويلة وفهم محتوى الفيديو وتوليده.