HyperAIHyperAI
vor 2 Monaten

Effiziente und dennoch tiefe Faltungsneuronale Netze für die semantische Segmentierung

Sharif Amit Kamran; Ali Shihab Sabbir
Effiziente und dennoch tiefe Faltungsneuronale Netze für die semantische Segmentierung
Abstract

Semantische Segmentierung mit tiefen Faltungsneuronalen Netzen stellt eine komplexere Herausforderung für GPU-intensive Aufgaben dar. Da es Millionen von Parametern zu berechnen gilt, führt dies zu einem hohen Speicherverbrauch. Zudem neigt die Extraktion feinerer Merkmale und das durchgeführte überwachte Training dazu, die Komplexität zu erhöhen. Mit der Einführung von Fully Convolutional Neural Networks (FCN), die feinere Strides verwenden und Deconvolutionschichten zur Upsampling einsetzen, ist diese Methode zum Standard für Bildsegmentierungsaufgaben geworden. In dieser Arbeit schlagen wir zwei Segmentierungsarchitekturen vor, die nicht nur ein Drittel weniger Parameter benötigen, sondern auch eine höhere Genauigkeit als vergleichbare Architekturen erzielen. Die Modellgewichte wurden aus bekannten neuronalen Netzen wie VGG19 und VGG16 übertragen, die auf dem Imagenet-Klassifikationsdatensatz trainiert wurden. Anschließend transformieren wir alle vollständig verbundenen Schichten in Faltungsschichten und verwenden dilatierte Faltung, um die Anzahl der Parameter zu reduzieren. Schließlich fügen wir feinere Strides hinzu und integrieren vier Skip-Architekturen, die elementweise mit den Deconvolutionschichten in Schritten addiert werden. Wir trainieren und testen unser Modell auf verschiedenen spärlichen und feinen Datensätzen wie Pascal VOC2012, Pascal-Context und NYUDv2 und zeigen, wie unser Modell bei diesen Aufgaben besser abschneidet. Andererseits hat unser Modell eine kürzere Inferenzzeit und verbraucht weniger Speicher für das Training und Testen auf NVIDIA Pascal-GPUs, was es zu einer effizienteren und speicherparener sparsameren Architektur für pixelgenaue Segmentierung macht.

Effiziente und dennoch tiefe Faltungsneuronale Netze für die semantische Segmentierung | Neueste Forschungsarbeiten | HyperAI