HyperAIHyperAI
منذ 2 أشهر

نماذج تفتيت الفيديو

Jonathan Ho; Tim Salimans; Alexey Gritsenko; William Chan; Mohammad Norouzi; David J. Fleet
نماذج تفتيت الفيديو
الملخص

إن إنتاج مقاطع الفيديو ذات الجودة العالية والترابط الزمني هو خطوة مهمة في بحوث نماذج التوليد. نحقق تقدماً نحو هذه الخطوة من خلال اقتراح نموذج تفريقي لـ إنتاج الفيديو يظهر نتائج أولية واعدة للغاية. يعتبر نموذجنا توسيعاً طبيعياً للهندسة المعمارية القياسية للتفريق الصوري، وهو يمكّن التدريب المشترك من بيانات الصور والفيديوهات، مما نجد أنه يقلل من تباين تadients الدُفعات الصغيرة ويُسرِّع عملية الأمثلة. لتقديم مقاطع فيديو طويلة وبدقة أعلى، قدمنا تقنية عينة شرطية جديدة للتوسعة المكانية والزمانية للفيديو التي أداءها أفضل من الطرق المقترحة سابقًا. نقدم النتائج الأولى لمهمة إنتاج الفيديو المشروطة بالنص على نطاق واسع، بالإضافة إلى أفضل النتائج الحالية في مقاييس محددة لتوقع الفيديو وإنتاج الفيديو غير الشرطي. يمكن الوصول إلى المواد الإضافية عبر الرابط: https://video-diffusion.github.io/注释:- "minibatch gradients" 翻译为 "تadients الدُفعات الصغيرة",其中 "تgradients" 保留了英文原词以保持专业性。- "state-of-the-art" 翻译为 "أفضل النتائج الحالية",这是在阿拉伯语中常用的表达方式。- 其他术语如 “temporally coherent” 和 “spatial and temporal video extension” 已经根据阿拉伯语的习惯进行了翻译。

نماذج تفتيت الفيديو | أحدث الأوراق البحثية | HyperAI