变分自编码器 Variational Autoencoder (VAE)

机器学习中,变分自编码器 (Variational Autoencoder,VAE) 是由 Diederik P. Kingma 和 Max Welling 提出的一种人工神经网络结构,属于概率图模式和变分贝叶斯方法。

它是专门设计用于捕获给定数据集的潜在概率分布并生成新样本的生成模型。它们利用包含编码器-解码器结构的架构。编码器将输入数据转换为潜在形式,解码器旨在基于该潜在表示重建原始数据。 VAE 被编程为最小化原始数据和重建数据之间的差异,使其能够理解底层数据分布并生成符合相同分布的新样本。

VAE 的一个显着优势是它们能够生成类似于训练数据的新数据样本。由于 VAE 的潜在空间是连续的,因此解码器可以生成在训练数据点之间无缝插值的新数据点。 VAE 在密度估计和文本生成等各个领域都有应用。

变分自编码器的架构

VAE 通常有两个主要组件:编码器连接和解码器连接。编码器网络将输入数据转换为低维秘密空间,通常称为「秘密代码」。

可以研究各种神经网络拓扑(例如全连接神经网络或卷积神经网络)来实现编码器网络。选择的架构是基于数据的特征。编码器网络产生采样和生成潜在代码所需的基本参数,例如高斯分布的均值和方差。

同样,研究人员可以使用各种类型的神经网络构建解码器网络,其目标是从提供的潜在代码重建原始数据。

参考来源

【1】https://zh.wikipedia.org/wiki/%E5%8F%98%E5%88%86%E8%87%AA%E7%BC%96%E7%A0%81%E5%99%A8

【2】https://www.analyticsvidhya.com/blog/2023/07/an-overview-of-variational-autoencoders/