HyperAI

Autoencodeur Variationnel (VAE)

En apprentissage automatique, l'autoencodeur variationnel (VAE) est une structure de réseau neuronal artificiel proposée par Diederik P. Kingma et Max Welling, qui appartient au modèle graphique probabiliste et à la méthode bayésienne variationnelle.

Il s’agit d’un modèle génératif spécialement conçu pour capturer la distribution de probabilité sous-jacente d’un ensemble de données donné et générer de nouveaux échantillons.Ils utilisent une architecture qui comprend une structure encodeur-décodeur. L'encodeur transforme les données d'entrée en une forme latente et le décodeur vise à reconstruire les données originales sur la base de cette représentation latente. Les VAE sont programmés pour minimiser la différence entre les données originales et reconstruites, leur permettant de comprendre la distribution des données sous-jacentes et de générer de nouveaux échantillons conformes à la même distribution.

Un avantage significatif des VAE est leur capacité à générer de nouveaux échantillons de données similaires aux données de formation. Étant donné que l’espace latent du VAE est continu, le décodeur peut générer de nouveaux points de données qui s’interpolent de manière transparente entre les points de données d’entraînement. Le VAE a des applications dans divers domaines tels que l’estimation de la densité et la génération de texte.

Architecture de l'auto-encodeur variationnel

Les VAE comportent généralement deux composants principaux : les connexions de l'encodeur et les connexions du décodeur. Le réseau d’encodeurs transforme les données d’entrée en un espace secret de faible dimension, souvent appelé « code secret ».

Différentes topologies de réseaux neuronaux (par exemple, des réseaux neuronaux entièrement connectés ou des réseaux neuronaux convolutifs) peuvent être étudiées pour mettre en œuvre le réseau d'encodeurs. L'architecture choisie est basée sur les caractéristiques des données. Le réseau d'encodeurs produit les paramètres de base nécessaires à l'échantillonnage et à la génération de codes latents, tels que la moyenne et la variance de la distribution gaussienne.

De même, les chercheurs peuvent utiliser différents types de réseaux neuronaux pour construire un réseau de décodeurs, dont le but est de reconstruire les données originales à partir du code latent fourni.

Références

【1】https://zh.wikipedia.org/wiki/%E5%8F%98%E5%88%86%E8%87%AA%E7%BC%96%E7%A0%81%E5%99%A8

【2】https://www.analyticsvidhya.com/blog/2023/07/an-overview-of-variational-autoencoders/