Trainierbare nichtlineare Reaktion-Diffusion: Ein flexibles Framework für schnelle und effektive Bildrestauration

Bildrestauration ist ein langjähriges Problem im Bereich der niedrigstufigen Computer Vision mit zahlreichen interessanten Anwendungen. Wir beschreiben ein flexibles Lernframework, das auf dem Konzept nichtlinearer Reaktions-Diffusionsmodelle basiert und für verschiedene Bildrestaurationsprobleme geeignet ist. Durch die Einbeziehung neuer Verbesserungen in nichtlinearen Diffusionsmodellen schlagen wir ein dynamisches nichtlineares Reaktions-Diffusionsmodell vor, das zeitabhängige Parameter (d.h., lineare Filter und Einflussfunktionen) verwendet. Im Gegensatz zu früheren nichtlinearen Diffusionsmodellen werden alle Parameter, einschließlich der Filter und Einflussfunktionen, simultan aus Trainingsdaten durch einen verlustbasierten Ansatz gelernt. Wir bezeichnen diesen Ansatz als TNRD -- \textit{Trainables Nichtlineares Reaktions-Diffusionsmodell}. Der TNRD-Ansatz ist für eine Vielzahl von Bildrestaurationsaufgaben anwendbar, indem man die entsprechende Reaktionskraft einbezieht. Wir demonstrieren seine Fähigkeiten anhand dreier repräsentativer Anwendungen: Gaußsche Bildentrausung, Super-Resolution von einzelnen Bildern und JPEG-Dekompression. Experimente zeigen, dass unsere trainierten nichtlinearen Diffusionsmodelle stark von der Parametertuning profitieren und letztendlich die besten gemeldeten Leistungen auf üblichen Testdatensätzen für die getesteten Anwendungen erzielen. Unsere trainierten Modelle bewahren die strukturelle Einfachheit von Diffusionsmodellen und benötigen nur wenige Diffusionsschritte, wodurch sie sehr effizient sind. Darüber hinaus eignen sie sich auch gut für parallele Berechnungen auf GPUs, was den Inferenzprozess extrem schnell macht.