2ヶ月前

実用的なフル解像度学習型無損失画像圧縮

Fabian Mentzer; Eirikur Agustsson; Michael Tschannen; Radu Timofte; Luc Van Gool
実用的なフル解像度学習型無損失画像圧縮
要約

我々は実用的な学習型無損失画像圧縮システムの最初の提案であるL3Cを提示し、その性能が人気のあるエンジニアリングされたコーデック(PNG、WebP、JPEG 2000)を上回ることを示します。当手法の中心には、適応的なエントロピー符号化のための完全に並列化可能な階層的確率モデルがあり、このモデルは圧縮タスクのために端から端まで最適化されています。最近の自己回帰離散確率モデル(例:PixelCNN)とは対照的に、当手法はi) 画像分布をRGB空間だけでなく、学習した補助表現と共に共同でモデル化し、ii) 全てのピクセル確率を予測するために各ピクセルごとに1回ではなく3回のみの順方向パスが必要です。その結果、L3Cは最も高速なPixelCNN変種(Multiscale-PixelCNN)と比較してサンプリング時に2桁以上の速度向上を達成しています。さらに、補助表現を学習することが重要であり、RGBピラミッドなどの事前に定義された補助表現よりも優れた性能を発揮することを見出しました。

実用的なフル解像度学習型無損失画像圧縮 | 最新論文 | HyperAI超神経