Lernende Deconvolutionsnetzwerke für die semantische Segmentierung

Wir schlagen einen neuen Algorithmus für semantische Segmentierung vor, der auf dem Lernen eines Deconvolutionsnetzes basiert. Das Netzwerk wird auf den von der VGG 16-Schicht-Netz übernommenen Faltungsschichten trainiert. Das Deconvolutionsnetz besteht aus Deconvolution- und Unpooling-Schichten, die Pixelweise Klassenlabels identifizieren und Segmentationsmasken vorhersagen. Wir wenden das trainierte Netzwerk auf jeden Vorschlag in einem Eingabebild an und bauen die endgültige semantische Segmentierungskarte durch einfache Kombination der Ergebnisse aller Vorschläge auf. Der vorgeschlagene Algorithmus mildert die Einschränkungen vorhandener Methoden, die auf vollständig faltungsnetzbasierten Ansätzen beruhen, indem er ein tiefes Deconvolutionsnetz und vorschlagsweise Vorhersage integriert; unsere Segmentierungs METHODE identifiziert in der Regel detaillierte Strukturen und behandelt Objekte in verschiedenen Maßstäben natürlich. Unser Netzwerk zeigt eine herausragende Leistung im PASCAL VOC 2012-Datensatz, und wir erreichen die beste Genauigkeit (72,5 %) unter den Methoden, die ohne externe Daten trainiert wurden, durch Ensemblebildung mit dem vollständig faltungsnetzbasierten Ansatz.请注意,"METHODE" 这个单词在德语中不应该大写。正确的翻译应该是:Unsere Segmentierungsmethode identifiziert in der Regel detaillierte Strukturen und behandelt Objekte in verschiedenen Maßstäben natürlich.