HyperAIHyperAI
vor 8 Tagen

Dual Residual Attention Network für die Bildrauschunterdrückung

Wencong Wu, Shijie Liu, Yi Zhou, Yungang Zhang, Yu Xiang
Dual Residual Attention Network für die Bildrauschunterdrückung
Abstract

Bei der Bildrauschunterdrückung können tiefe faltende neuronale Netzwerke (CNNs) eine ansprechende Leistung bei der Entfernung von raumunabhängigen Rauschmustern erzielen. Allerdings schneiden viele dieser Netzwerke bei der Entfernung von echtem Rauschen – also raumvariantem Rauschen, das während der Bildaufnahme oder -übertragung entsteht – nur schlecht ab, was ihre Anwendung in praktischen Bildrauschunterdrückungsaufgaben erheblich einschränkt. Anstatt die Tiefe der Netzwerke kontinuierlich zu erhöhen, haben zahlreiche Forscher gezeigt, dass auch eine Erweiterung der Breite der Netzwerke eine wirksame Möglichkeit zur Verbesserung der Modellleistung darstellt. Zudem wurde bestätigt, dass die Merkmalsfilterung die Lernfähigkeit der Modelle fördern kann. Daher schlagen wir in diesem Artikel ein neuartiges Dual-Branch-Residual-Attention-Netzwerk (DRANet) für die Bildrauschunterdrückung vor, das sowohl die Vorteile einer breiten Netzarchitektur als auch eine auf Aufmerksamkeit gestützte Merkmalslernstrategie vereint. Das vorgeschlagene DRANet verfügt über zwei unterschiedliche parallele Zweige, die komplementäre Merkmale erfassen und somit die Lernfähigkeit des Modells verstärken. Wir haben einen neuen residualen Aufmerksamkeitsblock (RAB) sowie einen neuartigen hybriden dilatierten residualen Aufmerksamkeitsblock (HDRAB) für den oberen und den unteren Zweig entwickelt. Der RAB und der HDRAB können durch mehrfache Skip-Verbindungen zwischen verschiedenen Faltungs- und Konvolutionsschichten reichhaltige lokale Merkmale erfassen, während unerhebliche Merkmale durch die residualen Aufmerksamkeitsmodule eliminiert werden. Gleichzeitig ermöglichen die langen Skip-Verbindungen innerhalb jedes Zweigs sowie die globale Merkmalsfusion zwischen den beiden parallelen Zweigen die Erfassung globaler Merkmale. Darüber hinaus verwendet das vorgeschlagene DRANet Downsampling-Operationen und dilatierte Faltungen, um die Größe des Empfindlichkeitsfeldes (Receptive Field) zu vergrößern, wodurch DRANet in der Lage ist, umfassendere Kontextinformationen aus dem Bild zu erfassen. Umfangreiche Experimente zeigen, dass DRANet im Vergleich zu anderen modernsten Methoden zur Rauschunterdrückung sowohl bei der Entfernung synthetischen als auch von echtem, realen Rauschen konkurrenzfähige Ergebnisse erzielt.

Dual Residual Attention Network für die Bildrauschunterdrückung | Neueste Forschungsarbeiten | HyperAI