Command Palette
Search for a command to run...
Neubewertung der atrösen Faltung für die semantische Bildsegmentierung
Neubewertung der atrösen Faltung für die semantische Bildsegmentierung
Chen Liang-Chieh Papandreou George Schroff Florian Adam Hartwig
Zusammenfassung
In dieser Arbeit betrachten wir erneut die atrous-Konvolution, ein leistungsfähiges Werkzeug zur expliziten Anpassung des Filterfeldes sowie zur Steuerung der Auflösung der durch tiefe Faltungsneuronale Netze berechneten Merkmalsantworten, im Kontext der semantischen Bildsegmentierung. Um das Problem der Segmentierung von Objekten auf mehreren Skalen anzugehen, entwerfen wir Module, die die atrous-Konvolution in Kaskade oder parallel einsetzen, um multiskalaren Kontext durch die Verwendung mehrerer atrous-Raten zu erfassen. Darüber hinaus schlagen wir vor, unseren zuvor vorgeschlagenen Atrous Spatial Pyramid Pooling-Modul, der Faltungsmerkmale auf mehreren Skalen analysiert, durch bildweite Merkmale zu ergänzen, die globale Kontextinformationen kodieren, und damit die Leistung weiter zu steigern. Wir erläutern zudem Implementierungsdetails und teilen unsere Erfahrungen beim Training unseres Systems. Das vorgeschlagene System „DeepLabv3“ übertrifft unsere früheren DeepLab-Versionen deutlich, insbesondere ohne nachgeschaltete Post-Verarbeitung mittels DenseCRF, und erreicht eine vergleichbare Leistung mit anderen führenden Modellen im Benchmark für semantische Bildsegmentierung PASCAL VOC 2012.