مجموعة بيانات معيارية لفيديو الورق Paper2Video
Paper2Video هي أول مجموعة بيانات مرجعية لمزاوجة الورق والفيديو تنشرها الجامعة الوطنية في سنغافورة في عام 2025.Paper2Video: إنشاء فيديو تلقائي من الأوراق العلمية"، والذي يهدف إلى توفير معيار مرجعي ومورد تقييم لمهمة إنشاء مقاطع فيديو العرض التقديمي تلقائيًا (بما في ذلك الشرائح والترجمات والصوت وصور المتحدثين الرمزية) من الأوراق الأكاديمية.
تحتوي مجموعة البيانات على ١٠١ زوجًا من الأوراق البحثية والفيديوهات. يبلغ متوسط طول كل ورقة بحثية حوالي ٢٨.٧ صفحة، وتحتوي على حوالي ١٣٣٠٠ كلمة، و٤٤.٧ شكلًا بيانيًا. يبلغ متوسط طول كل فيديو حوالي ٦ دقائق و١٥ ثانية، ويتراوح بين ١٤ دقيقة و١٦ شريحة. بالإضافة إلى الورقة البحثية والفيديو، تتضمن كل عينة بيانات وصفية للورقة البحثية (بما في ذلك العنوان، والرابط، واسم المؤتمر، والسنة)، وصورة للمتحدث، وعينة صوتية.
تكوين البيانات
- ملف البيانات الوصفية: يحتوي على حقول مثل عنوان الورقة (paper)، ورابط الورقة (paper_link)، ورابط فيديو العرض التقديمي (presentation_link)، واسم المؤتمر (conference)، والسنة (year) لكل عينة.
- ملفات هوية المؤلف، والتي يمكن استخدامها لمهام مثل توليف المتحدث المخصص، وتقديم المتحدث، وتوليد فيديو الصورة الرمزية:
- يجب على كل مؤلف تضمين صورة تعريفية (على سبيل المثال، ref_img.png)
- عينات صوتية (مثل ref_audio.wav)
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.