2달 전
실용적인 전체 해상도 학습된 무손실 이미지 압축
Fabian Mentzer; Eirikur Agustsson; Michael Tschannen; Radu Timofte; Luc Van Gool

초록
우리는 첫 번째 실용적인 학습 기반 무손실 이미지 압축 시스템인 L3C를 제안하고, 이 시스템이 인기 있는 엔지니어링 코덱인 PNG, WebP 및 JPEG 2000보다 우수한 성능을 보임을 입증합니다. 우리의 방법의 핵심은 적응 엔트로피 부호화를 위해 최적화된 완전 병렬화 가능한 계층적 확률 모델입니다. 이는 압축 작업에 대해 단일 픽셀마다 하나씩이 아닌 세 번의 순방향 패스만으로 모든 픽셀 확률을 예측할 수 있다는 점에서 최근의 자기 회귀 이산 확률 모델(PixelCNN)과 대조됩니다. 또한, 우리의 방법은 i) 이미지 분포를 RGB 공간에서만 독점적으로 모델링하는 것이 아니라 학습된 보조 표현과 함께 공동으로 모델링하며, ii) 가장 빠른 PixelCNN 변형(Multiscale-PixelCNN)에 비해 샘플링 시 두 자릿수 이상의 속도 향상을 얻습니다. 더욱이, 우리는 보조 표현을 학습하는 것이 결정적이며, RGB 피라미드와 같은 사전 정의된 보조 표현보다 크게 우수함을 발견했습니다.