HyperAIHyperAI
منذ 7 أيام

Imagen Video: إنشاء مقاطع فيديو عالية الدقة باستخدام نماذج التباعد

Jonathan Ho, William Chan, Chitwan Saharia, Jay Whang, Ruiqi Gao, Alexey Gritsenko, Diederik P. Kingma, Ben Poole, Mohammad Norouzi, David J. Fleet, Tim Salimans
Imagen Video: إنشاء مقاطع فيديو عالية الدقة باستخدام نماذج التباعد
الملخص

نقدّم "Imagen Video"، نظامًا لإنشاء مقاطع فيديو شرطيّة بالنص، مبنيّ على سلسلة من نماذج التوزيع التدرّجي للفيديوهات. عند تزويد النظام بوصف نصي، يقوم Imagen Video بإنشاء مقاطع فيديو عالية الدقة باستخدام نموذج أساسي لإنشاء الفيديو، بالإضافة إلى سلسلة من نماذج التحسين الفرعي الفرعي (المساحة والزمن) المُتداخلة. ونُفصّل في كيفية توسيع النظام ليصبح نموذجًا نصّيًا إلى فيديو عالي الدقة، مع توضيح قرارات التصميم مثل اختيار نماذج التحسين الفرعي الكاملة بالتحويلات التلافيفية (fully-convolutional) للزمن والمكان عند ترتيبات معينة، وكذلك اختيار مُعامل v في نماذج التوزيع (v-parameterization). بالإضافة إلى ذلك، نؤكد ونُحول نتائج الأبحاث السابقة في مجال إنشاء الصور القائمة على التوزيع إلى سياق إنشاء الفيديو. وأخيرًا، نطبّق تقنية التقطيع التدرّجي التدريجي (progressive distillation) على نماذج الفيديو لدينا مع دعم غير مُصنّف (classifier-free guidance) لضمان عينات سريعة وعالية الجودة. ونجد أن Imagen Video لا يمتلك فقط القدرة على إنتاج مقاطع فيديو عالية الدقة، بل يمتلك أيضًا درجة عالية من التحكّم والمعرفة بالعالم، بما في ذلك القدرة على إنشاء مقاطع فيديو متنوعة ونصوص متحركة بأساليب فنية مختلفة، مع فهم ثلاثي الأبعاد للأجسام. لمزيد من الأمثلة، يُرجى زيارة: https://imagen.research.google/video/

Imagen Video: إنشاء مقاطع فيديو عالية الدقة باستخدام نماذج التباعد | أحدث الأوراق البحثية | HyperAI