2 个月前

实用全分辨率学习无损图像压缩

Fabian Mentzer; Eirikur Agustsson; Michael Tschannen; Radu Timofte; Luc Van Gool
实用全分辨率学习无损图像压缩
摘要

我们提出了一种首个实用的基于学习的无损图像压缩系统——L3C,并证明其性能优于流行的工程编解码器PNG、WebP和JPEG 2000。我们的方法核心是一种完全可并行化的分层概率模型,用于自适应熵编码,并针对压缩任务进行了端到端优化。与最近的自回归离散概率模型(如PixelCNN)不同,我们的方法i) 通过学习到的辅助表示与图像分布联合建模,而不仅仅是对RGB空间中的图像分布进行建模;ii) 只需要三次前向传递即可预测所有像素的概率,而不是每个像素都需要一次前向传递。因此,L3C在采样时比最快的PixelCNN变体(Multiscale-PixelCNN)快两个数量级以上。此外,我们发现学习辅助表示至关重要,并且显著优于预定义的辅助表示(如RGB金字塔)。