HyperAIHyperAI
vor 2 Monaten

Rethinking Atrous Convolution for Semantic Image Segmentation Überdenken der Atrous-Konvolution für die semantische Bildsegmentierung

Chen, Liang-Chieh ; Papandreou, George ; Schroff, Florian ; Adam, Hartwig
Rethinking Atrous Convolution for Semantic Image Segmentation
Überdenken der Atrous-Konvolution für die semantische Bildsegmentierung
Abstract

In dieser Arbeit untersuchen wir die atrous-Konvolution, ein leistungsfähiges Werkzeug zur expliziten Anpassung des Sichtfeldes von Filtern sowie zur Steuerung der Auflösung der durch tiefgängige Faltungsneuronale Netze (Deep Convolutional Neural Networks) berechneten Merkmalsantworten, im Kontext der semantischen Bildsegmentierung. Um das Problem der Segmentierung von Objekten in verschiedenen Skalen anzugehen, entwerfen wir Module, die atrous-Konvolutionen in Kaskade oder parallel einsetzen, um mehrskaligen Kontext durch die Verwendung verschiedener atrous-Raten zu erfassen. Darüber hinaus schlagen wir vor, unser zuvor vorgeschlagenes Modul für die atrous-räumliche Pyramidensegmentierung (Atrous Spatial Pyramid Pooling) um bildbasierte Merkmale zu erweitern, die den globalen Kontext kodieren und so die Leistung weiter verbessern. Wir gehen auch auf Implementierungsdetails ein und teilen unsere Erfahrungen bei der Schulung unseres Systems. Das vorgeschlagene "DeepLabv3"-System verbessert sich signifikant gegenüber unseren früheren DeepLab-Versionen ohne nachfolgende DenseCRF-Verarbeitung und erreicht vergleichbare Leistungen mit anderen state-of-the-art-Modellen beim PASCAL VOC 2012-Benchmark für semantische Bildsegmentierung.

Rethinking Atrous Convolution for Semantic Image Segmentation Überdenken der Atrous-Konvolution für die semantische Bildsegmentierung | Neueste Forschungsarbeiten | HyperAI