Variationales Denoising-Netzwerk: Auf dem Weg zu blindem Rauschmodellierung und -entfernung

Blindes Bildrauschenentfernen ist ein wichtiges, aber sehr herausforderndes Problem in der Computer Vision aufgrund des komplexen Erfassungsprozesses von realen Bildern. In dieser Arbeit schlagen wir eine neue Variationsinferenzmethode vor, die sowohl die Schätzung des Rauschens als auch das Entfernen des Rauschens in einen einheitlichen bayesschen Rahmen integriert, um blindes Bildrauschen zu entfernen. Insbesondere wird eine approximierte A-posteriori-Verteilung vorgestellt, die durch tief neuronalen Netze parametrisiert ist und die intrinsische saubere Bilddaten und Rauschvarianzen als latente Variablen unter Berücksichtigung des eingegebenen rauschigen Bildes modelliert. Diese A-posteriori-Verteilung bietet explizite parametrische Formen für alle involvierten Hyperparameter und kann daher leicht zur blinden Bildrauschenentfernung implementiert werden, wobei das Rauschen automatisch für das Testbild geschätzt wird. Einerseits kann unsere Methode, genannt Variational Denoising Network (VDN), aufgrund ihrer expliziten Form der A-posteriori-Darstellung effizient das Rauschen entfernen, ähnlich wie andere datengesteuerte Tiefenlernmethoden. Andererseits erbt VDN die Vorteile traditioneller modellgesteuerter Ansätze, insbesondere die gute Generalisierungsfähigkeit generativer Modelle. VDN verfügt über eine gute Interpretierbarkeit und kann flexibel verwendet werden, um kompliziertes nicht-i.i.d.-Rauschen (non-i.i.d.) zu schätzen und zu entfernen, das in realistischen Szenarien auftritt. Um die Überlegenheit unserer Methode bei der blinden Bildrauschenentfernung zu belegen, wurden umfassende Experimente durchgeführt.