ядاريات أبعاد أقل للمرشحات الفيديوية

تقدم هذه الدراسة تحليلًا للمحرّكات المستخدمة في الشبكات التوليدية المتنافسة (GANs) الخاصة بالفيديو. نُظهر أن معمارية المُحدِّدات غير المقيدة للفيديو تُنتج سطحًا خسارة (loss surface) ذو انحناء عالي، مما يُعقّد عملية التحسين. كما نُظهر أن هذا الانحناء يصبح أكثر حدة كلما زاد الحد الأقصى لبعد النواة (kernel dimension) في مُحدِّدات الفيديو. وباستنادًا إلى هذه الملاحظات، نُقدّم عائلة من مُحدِّدات الفيديو منخفضة الأبعاد الفعّالة لشبكات GAN (LDVD GANs). تُحسّن العائلة المقترحة من المُحدِّدات أداء نماذج GAN الخاصة بالفيديو التي تُطبّق عليها، وتُظهر أداءً ممتازًا على مجموعات بيانات معقدة ومتنوعة مثل UCF-101. وبخاصة، نُظهر أن هذه المُحدِّدات تستطيع مضاعفة أداء نماذج Temporal-GAN، وتُحقّق أداءً من الطراز الرائد (state-of-the-art) باستخدام بطاقة رسوميات واحدة فقط.