HyperAIHyperAI
vor 8 Tagen

R3L: Verbindung von Deep Reinforcement Learning und rekurrenten neuronalen Netzen für die Bildrauschunterdrückung über residualen Wiederherstellung

Rongkai Zhang, Jiang Zhu, Zhiyuan Zha, Justin Dauwels, Bihan Wen
R3L: Verbindung von Deep Reinforcement Learning und rekurrenten neuronalen Netzen für die Bildrauschunterdrückung über residualen Wiederherstellung
Abstract

Zustandsbeste Bildrauschunterdrückungsalgorithmen nutzen verschiedene Arten tiefer neuronaler Netze mittels deterministischer Trainingsstrategien. Alternativ haben kürzlich erschienene Arbeiten tiefe Verstärkungslernverfahren (deep reinforcement learning) für die Bildrekonstruktion bei vielfältigen oder unbekannten Störungen eingesetzt. Obwohl tiefes Verstärkungslernen effektive Polynetzwerke zur Auswahl von Operatoren oder zur Architektursuche in der Bildrekonstruktion generieren kann, ist unklar, wie es mit der klassischen deterministischen Trainingsstrategie zur Lösung inverser Probleme verbunden ist. In dieser Arbeit präsentieren wir ein neuartiges Bildrauschunterdrückungsverfahren namens R3L (Residual Recovery using Reinforcement Learning). Wir zeigen, dass R3L äquivalent zu einem tiefen rekurrenten neuronalen Netzwerk ist, das mit einem stochastischen Belohnungssignal trainiert wird – im Gegensatz zu vielen gängigen Rauschunterdrückungsalgorithmen, die mit überwachtem Lernen und deterministischen Verlustfunktionen arbeiten. Um die Wirksamkeit des Verstärkungslernens in R3L zu bewerten, trainieren wir ein rekurrentes neuronales Netzwerk mit identischer Architektur für die Residuenrekonstruktion mittels deterministischen Verlustes, um zu analysieren, wie sich die beiden unterschiedlichen Trainingsstrategien auf die Rauschunterdrückungsleistung auswirken. Mit diesem einheitlichen Benchmarking-System zeigen wir, dass das vorgeschlagene R3L gegenüber seinen Kontrasten mit deterministischem Training sowie gegenüber verschiedenen state-of-the-art-Algorithmen zur Bildrauschunterdrückung eine bessere Generalisierbarkeit und Robustheit bei variierenden geschätzten Rauschpegeln aufweist.