HyperAIHyperAI
منذ شهر واحد

تحسين شبكات الـ VRNN المشروطة لتنبؤ الفيديو

Lluis Castrejon; Nicolas Ballas; Aaron Courville
تحسين شبكات الـ VRNN المشروطة لتنبؤ الفيديو
الملخص

تنبؤ الإطارات المستقبلية لمقطع فيديو هو مهمة نموذجية توليدية صعبة. من بين الأساليب الواعدة نجد النماذج المتغيرة الاحتمالية مثل مُشفِّر التباين (Variational Auto-Encoder). رغم أن مُشفِّرات التباين قادرة على التعامل مع عدم اليقين ونمذجة العديد من النتائج المستقبلية الممكنة، إلا أنها تميل إلى إنتاج تنبؤات غير واضحة. في هذا البحث، نعتقد أن هذا يشير إلى قلة التكيف. لمعالجة هذه المشكلة، نقترح زيادة قوة التعبير للتوزيعات المتغيرة واستخدام نماذج احتمالية ذات طاقة أعلى. تعتمد طريقتنا على هرم من المتغيرات الكامنة، والذي يحدد عائلة من التوزيعات الأولية واللاحقة المرنة لتحسين نمذجة احتمالية السلاسل المستقبلية. نتحقق من مقترحنا عبر سلسلة من التجارب الاستبعادية ونقارن طريقتنا مع أفضل النماذج المتغيرة الحالية. أظهرت طريقتنا أداءً متفوقًا تحت عدة مقاييس في ثلاثة مجموعات بيانات مختلفة.

تحسين شبكات الـ VRNN المشروطة لتنبؤ الفيديو | أحدث الأوراق البحثية | HyperAI