
摘要
主成分分析(Principal Component Analysis, PCA)在固定分量维度的线性模型类中,最小化重构误差。概率主成分分析(Probabilistic PCA)通过学习PCA隐空间权重的概率分布,引入了概率结构,从而构建出一个生成模型。自编码器(Autoencoder, AE)则在固定隐空间维度的非线性模型类中最小化重构误差,在相同维度下表现优于PCA。本文提出一种概率自编码器(Probabilistic Autoencoder, PAE),其利用归一化流(Normalizing Flow, NF)学习自编码器隐空间权重的概率分布。PAE训练快速简便,能够实现较低的重构误差、高质量的样本生成,并在下游任务中表现出色。我们将PAE与变分自编码器(Variational Autoencoder, VAE)进行对比,结果表明:PAE训练速度更快,能达到更低的重构误差,且在无需特殊超参数调优或复杂训练流程的情况下,仍能生成高质量样本。进一步实验表明,PAE在贝叶斯推断框架下,对于图像修复(inpainting)和去噪(denoising)等逆问题的 probabilistic image reconstruction 任务中,具有强大的建模能力。最后,我们发现由归一化流所建模的隐空间密度,是一种极具潜力的异常检测指标。