11일 전

MLIC: 학습된 이미지 압축을 위한 다중 기준 엔트로피 모델

Wei Jiang, Jiayu Yang, Yongqi Zhai, Peirong Ning, Feng Gao, Ronggang Wang
MLIC: 학습된 이미지 압축을 위한 다중 기준 엔트로피 모델
초록

최근 들어 학습 기반 이미지 압축 기술은 뛰어난 성능을 달성하고 있다. 비트 전송률과 재구성 품질 간의 균형을 개선하는 데 핵심적인 역할을 하는 엔트로피 모델은 잠재 표현(latent representation)의 분포를 추정하는 데 중점을 둔다. 그러나 대부분의 엔트로피 모델은 단일 차원에서만 상관관계를 모델링할 뿐이며, 잠재 표현 내에는 채널 간 상관관계, 국소적 공간 상관관계, 전역적 공간 상관관계가 모두 존재한다. 이 문제를 해결하기 위해 우리는 다중 기준 엔트로피 모델(Multi-Reference Entropy Model, MEM)과 그 고급 버전인 MEM$^+$를 제안한다. 이 모델들은 잠재 표현 내에 존재하는 다양한 유형의 상관관계를 효과적으로 포착한다. 구체적으로, 먼저 잠재 표현을 슬라이스로 나누고, 현재 슬라이스를 복호화할 때 이전에 복호화된 슬라이스들을 컨텍스트로 활용한다. 또한, 이전 슬라이스의 어텐션 맵을 이용하여 현재 슬라이스의 전역적 상관관계를 예측한다. 국소적 컨텍스트를 효과적으로 포착하기 위해 성능 저하를 방지하는 두 가지 개선된 체스보드 기반 컨텍스트 포착 기법을 도입하였다. MEM 및 MEM$^+$ 기반으로, MLIC 및 MLIC$^+$라는 이미지 압축 모델을 제안한다. 광범위한 실험 평가를 통해 MLIC 및 MLIC$^+$ 모델이 최신 기술 수준의 성능을 달성함을 입증하였으며, PSNR 기준으로 VTM-17.0 대비 Kodak 데이터셋에서 BD-rate를 각각 8.05%와 11.39% 감소시켰다. 코드는 https://github.com/JiangWeibeta/MLIC 에서 공개되어 있다.

MLIC: 학습된 이미지 압축을 위한 다중 기준 엔트로피 모델 | 최신 연구 논문 | HyperAI초신경