Command Palette
Search for a command to run...
RefineNet: Mehrpfad-Verfeinerungsnetzwerke für die hochauflösende semantische Segmentierung
RefineNet: Mehrpfad-Verfeinerungsnetzwerke für die hochauflösende semantische Segmentierung
Lin Guosheng Milan Anton Shen Chunhua Reid Ian
Zusammenfassung
Kürzlich haben sehr tiefe konvolutionelle neuronale Netze (CNNs) herausragende Leistungen bei der Objekterkennung gezeigt und sind zudem die erste Wahl für dichte Klassifikationsprobleme wie die semantische Segmentierung geworden. Allerdings führen wiederholte Untersampling-Operationen wie Pooling oder versetzte Konvolutionen in tiefen CNNs zu einer erheblichen Reduktion der ursprünglichen Bildauflösung. Hier stellen wir RefineNet vor, ein generisches Mehrpfad-Verfeinerungsnetz, das alle verfügbaren Informationen entlang des Untersampling-Prozesses explizit nutzt, um präzise Hochauflösungs-Vorhersagen unter Verwendung von langreichweitigen Residual-Verbindungen zu ermöglichen. Auf diese Weise können die tieferen Schichten, die hochwertige semantische Merkmale erfassen, direkt durch feinkörnige Merkmale aus früheren Konvolutionen verfeinert werden. Die einzelnen Komponenten von RefineNet verwenden Residual-Verbindungen im Sinne der Identitätsabbildung, was eine effektive end-to-end-Trainierung ermöglicht. Darüber hinaus führen wir verkettetes Residual-Pooling ein, das effizient reichhaltige Hintergrundkontextinformationen erfasst. Wir führen umfassende Experimente durch und erzielen neue Sollwert-Resultate auf sieben öffentlichen Datensätzen. Insbesondere erreichen wir auf dem anspruchsvollen PASCAL VOC 2012-Datensatz eine Intersection-over-Union-Score von 83,4, was bislang die beste veröffentlichte Leistung darstellt.