Praktische lernbasierte verlustfreie Bildkompression in voller Auflösung

Wir schlagen das erste praktische, gelernte verlustfreie Bildkompressionssystem, L3C, vor und zeigen, dass es die gängigen ingenieurtechnischen Codecs PNG, WebP und JPEG 2000 übertrifft. Im Zentrum unserer Methode steht ein vollständig parallelisierbares hierarchisches Wahrscheinlichkeitsmodell für adaptive Entropiekodierung, das von Anfang bis Ende für die Kompressionsaufgabe optimiert ist. Im Gegensatz zu aktuellen autoregressiven diskreten Wahrscheinlichkeitsmodellen wie PixelCNN hat unsere Methode i) ein gemeinsames Modell der Bildverteilung mit gelernten Hilfsrepräsentationen anstelle einer ausschließlichen Modellierung der Bildverteilung im RGB-Raum und ii) benötigt nur drei Vorwärtsdurchläufe, um alle Pixelwahrscheinlichkeiten vorherzusagen, anstatt einen pro Pixel. Als Ergebnis erzielt L3C bei der Stichprobenziehung gegenüber der schnellsten PixelCNN-Variante (Multiscale-PixelCNN) Geschwindigkeitsverbesserungen um mehr als zwei Größenordnungen. Darüber hinaus stellen wir fest, dass das Lernen der Hilfsrepräsentation entscheidend ist und vorgegebene Hilfsrepräsentationen wie eine RGB-Pyramide deutlich übertrifft.