HyperAIHyperAI
il y a 8 jours

Noyaux à dimension réduite pour les discriminateurs vidéo

Emmanuel Kahembwe, Subramanian Ramamoorthy
Noyaux à dimension réduite pour les discriminateurs vidéo
Résumé

Ce travail présente une analyse des discriminateurs utilisés dans les réseaux antagonistes génératifs (GANs) pour la vidéo. Nous montrons que les architectures de discriminateurs vidéo non contraintes entraînent une surface de perte aux courbures élevées, rendant l'optimisation difficile. Nous démontrons également que cette courbure s'accentue lorsque la dimension maximale du noyau des discriminateurs vidéo augmente. À partir de ces observations, nous proposons une famille de discriminateurs vidéo à dimension réduite efficaces pour les GANs (LDVD GANs). La famille de discriminateurs proposée améliore les performances des modèles GAN vidéo auxquels elle est appliquée et obtient des résultats remarquables sur des jeux de données complexes et diversifiés, tels que UCF-101. En particulier, nous montrons qu’elle peut doubler les performances des Temporal-GANs et atteindre un niveau d’état de l’art sur une seule carte graphique.

Noyaux à dimension réduite pour les discriminateurs vidéo | Articles de recherche récents | HyperAI