HyperAIHyperAI
vor 17 Tagen

Unsharp Masking Layer: Einbetten vorheriger Wissensinhalte in Faltungsnetzwerke für die Bildklassifikation

{Jordina Torrents-Barrena, Michael Granados-Menani, Adán Mora-Fallas, Saul Calderon-Ramirez, Jose Carranza-Rojas}
Abstract

Die Bildverbesserung bezieht sich auf die Verstärkung bestimmter Bildmerkmale wie Kanten, Grenzen oder Kontrast. Das Hauptziel besteht darin, das ursprüngliche Bild so zu verarbeiten, dass die Gesamtleistung bei Visualisierungs-, Klassifikations- und Segmentierungsaufgaben erheblich verbessert wird. Traditionelle Verfahren erfordern eine manuelle Feinabstimmung der Parameter, um das Verhalten der Verbesserung zu steuern. Bislang verwenden moderne Ansätze auf Basis von Faltungsneuronalen Netzen (Convolutional Neural Networks, CNN) diese Techniken häufig als erweiterten Vorverarbeitungsschritt. In dieser Arbeit stellen wir die erste intrinsische CNN-Vorverarbeitungsschicht vor, die auf dem bekannten Unsharp-Masking-Algorithmus basiert. Die vorgeschlagene Schicht integriert vorherige Wissensinformationen darüber, wie ein Bild effektiv verbessert werden kann, indem hochfrequente Informationen dem Eingabebild hinzugefügt werden, um anschließend bedeutungsvolle Bildmerkmale zu betonen. Die Schicht optimiert während des Trainings die Parameter des Unsharp-Masking-Verfahrens ohne jegliche manuelle Eingriffe. Wir evaluieren die Leistung des Netzwerks und dessen Einfluss auf zwei Anwendungen: die CIFAR100-Bildklassifikation und die PlantCLEF-Identifikationsaufgabe. Die Ergebnisse zeigen eine signifikante Verbesserung gegenüber etablierten CNNs, mit einer Steigerung um 9,49 % bei PlantCLEF und 2,42 % bei der allgemeinen CIFAR100-Aufgabe. Die Implementierung einer Unsharp-Verbesserungsschicht erhöht die Genauigkeit deutlich mit nur geringfügigem zusätzlichen Rechenaufwand bei einfachen CNN-Modellen, da vorheriges Wissen direkt in das Modell integriert wird, um dessen Robustheit zu steigern.