Command Palette
Search for a command to run...
مجموعة بيانات أداء الإجراءات المرئية VAP-Data
Date
Paper URL
License
Apache 2.0
بيانات VAP، التي أصدرتها بايت دانس عام ٢٠٢٥ بالتعاون مع الجامعة الصينية في هونغ كونغ، تُعد حاليًا أكبر مجموعة بيانات لتوليد الفيديو مُتحكم بها دلاليًا. عنوان البحث ذي الصلة هو "Video-As-Prompt: التحكم الدلالي الموحد لتوليد الفيديوالهدف هو توفير معايير تدريب وتقييم عالية الجودة لتوليد الفيديو المتحكم فيه، وتوليف الحركة المتحكم فيها، ونماذج الفيديو المتعددة الوسائط.
تحتوي هذه المجموعة من البيانات على أكثر من 90,000 عينة مُختارة بعناية، تغطي 100 شرط دلالي دقيق عبر أربع فئات دلالية: المفهوم، والأسلوب، والحركة، واللقطة. تتضمن كل فئة دلالية مجموعات متعددة من مقاطع الفيديو المترابطة. يُظهر محتوى الفيديو تنوعًا كبيرًا في الإضاءة، والمنظور، والمشهد، والديناميكيات، مما يُمكّن من بناء أنظمة توليد فيديو متعددة الدلالات ومُتحكم فيها بدقة، ويوفر بيئة تقييم شاملة لإمكانية التحكم في النموذج وقدرته على التعميم.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.