
摘要
建模自然图像的分布是无监督学习中的一个标志性问题。这一任务需要一个同时具备表达能力、可处理性和可扩展性的图像模型。我们提出了一种深度神经网络,该网络沿两个空间维度顺序预测图像中的像素。我们的方法对原始像素值的离散概率进行建模,并编码了图像中完整的依赖关系集。架构上的创新包括快速二维递归层和在深层递归网络中有效利用残差连接。我们在自然图像上实现了显著优于现有最佳水平的对数似然分数。我们的主要结果还提供了在多样化的ImageNet数据集上的基准测试。从模型生成的样本清晰、多样且全局连贯。
建模自然图像的分布是无监督学习中的一个标志性问题。这一任务需要一个同时具备表达能力、可处理性和可扩展性的图像模型。我们提出了一种深度神经网络,该网络沿两个空间维度顺序预测图像中的像素。我们的方法对原始像素值的离散概率进行建模,并编码了图像中完整的依赖关系集。架构上的创新包括快速二维递归层和在深层递归网络中有效利用残差连接。我们在自然图像上实现了显著优于现有最佳水平的对数似然分数。我们的主要结果还提供了在多样化的ImageNet数据集上的基准测试。从模型生成的样本清晰、多样且全局连贯。