HyperAIHyperAI
منذ 8 أيام

ядاريات أبعاد أقل للمرشحات الفيديوية

Emmanuel Kahembwe, Subramanian Ramamoorthy
ядاريات أبعاد أقل للمرشحات الفيديوية
الملخص

تقدم هذه الدراسة تحليلًا للمحرّكات المستخدمة في الشبكات التوليدية المتنافسة (GANs) الخاصة بالفيديو. نُظهر أن معمارية المُحدِّدات غير المقيدة للفيديو تُنتج سطحًا خسارة (loss surface) ذو انحناء عالي، مما يُعقّد عملية التحسين. كما نُظهر أن هذا الانحناء يصبح أكثر حدة كلما زاد الحد الأقصى لبعد النواة (kernel dimension) في مُحدِّدات الفيديو. وباستنادًا إلى هذه الملاحظات، نُقدّم عائلة من مُحدِّدات الفيديو منخفضة الأبعاد الفعّالة لشبكات GAN (LDVD GANs). تُحسّن العائلة المقترحة من المُحدِّدات أداء نماذج GAN الخاصة بالفيديو التي تُطبّق عليها، وتُظهر أداءً ممتازًا على مجموعات بيانات معقدة ومتنوعة مثل UCF-101. وبخاصة، نُظهر أن هذه المُحدِّدات تستطيع مضاعفة أداء نماذج Temporal-GAN، وتُحقّق أداءً من الطراز الرائد (state-of-the-art) باستخدام بطاقة رسوميات واحدة فقط.

ядاريات أبعاد أقل للمرشحات الفيديوية | أحدث الأوراق البحثية | HyperAI