HyperAIHyperAI
il y a 11 jours

Estimation contrastive de flux pour les modèles basés sur l'énergie

Ruiqi Gao, Erik Nijkamp, Diederik P. Kingma, Zhen Xu, Andrew M. Dai, Ying Nian Wu
Estimation contrastive de flux pour les modèles basés sur l'énergie
Résumé

Cet article étudie une méthode d'apprentissage visant à estimer conjointement un modèle basé sur l'énergie et un modèle basé sur les flux, dans laquelle les deux modèles sont mis à jour de manière itérative à l'aide d'une fonction de valeur adversaire partagée. Cette méthode d'apprentissage conjoint présente les caractéristiques suivantes. (1) La mise à jour du modèle basé sur l'énergie repose sur une estimation contrastive du bruit, où le modèle basé sur les flux sert de distribution de bruit puissante. (2) La mise à jour du modèle basé sur les flux minimise approximativement la divergence de Jensen-Shannon entre la distribution du modèle basé sur les flux et la distribution des données. (3) Contrairement aux réseaux génératifs adversariels (GAN), qui estiment une distribution de probabilité implicite définie par un modèle générateur, notre méthode estime deux distributions de probabilité explicites sur les données. Grâce à la méthode proposée, nous démontrons une amélioration significative de la qualité de synthèse du modèle basé sur les flux, et mettons en évidence l'efficacité de l'apprentissage non supervisé de caractéristiques par le modèle basé sur l'énergie appris. En outre, la méthode d'apprentissage proposée peut être facilement adaptée à l'apprentissage semi-supervisé, où nous obtenons des résultats compétitifs par rapport aux méthodes de pointe en apprentissage semi-supervisé.

Estimation contrastive de flux pour les modèles basés sur l'énergie | Articles de recherche récents | HyperAI