2 个月前

InfoGAN:通过信息最大化生成对抗网络实现可解释的表征学习

Xi Chen; Yan Duan; Rein Houthooft; John Schulman; Ilya Sutskever; Pieter Abbeel
InfoGAN:通过信息最大化生成对抗网络实现可解释的表征学习
摘要

本文介绍了InfoGAN,一种信息论扩展的生成对抗网络(Generative Adversarial Network, GAN),能够在完全无监督的情况下学习解耦表示。InfoGAN不仅是一个生成对抗网络,还最大化了一小部分潜在变量与观测值之间的互信息。我们推导了一个可以高效优化的互信息目标的下界,并展示了我们的训练过程可以被解释为Wake-Sleep算法的一种变体。具体而言,InfoGAN在MNIST数据集上成功地将书写风格与数字形状解耦,在3D渲染图像上将姿态与光照解耦,在SVHN数据集上将背景数字与中心数字解耦。此外,它还在CelebA人脸数据集上发现了包括发型、眼镜的存在/缺失以及情感在内的视觉概念。实验结果表明,InfoGAN学习到的可解释表示与现有全监督方法学习到的表示具有竞争力。