2 个月前

基于PixelCNN解码器的条件图像生成

Aaron van den Oord; Nal Kalchbrenner; Oriol Vinyals; Lasse Espeholt; Alex Graves; Koray Kavukcuoglu
基于PixelCNN解码器的条件图像生成
摘要

这项研究探讨了基于PixelCNN架构的新图像密度模型在条件图像生成中的应用。该模型可以接受任何向量作为条件输入,包括描述性标签或标签,或其他网络生成的潜在嵌入。当以ImageNet数据库中的类别标签为条件时,该模型能够生成多样且逼真的场景,涵盖不同的动物、物体、风景和建筑。当以单张未见过的人脸图像通过卷积网络生成的嵌入为条件时,它能够生成同一人物的各种新肖像,具有不同的面部表情、姿态和光照条件。我们还展示了条件PixelCNN可以作为图像自动编码器中的强大解码器。此外,所提出的模型中引入的门控卷积层提高了PixelCNN的对数似然性,使其在ImageNet上的表现达到了与PixelRNN相当的最先进水平,同时大大降低了计算成本。