HyperAIHyperAI
vor 17 Tagen

DenseASPP für die semantische Segmentierung in Straßen-Szenen

{Zhiwei Li, Maoke Yang, Kun Yu, Kuiyuan Yang, Chi Zhang}
DenseASPP für die semantische Segmentierung in Straßen-Szenen
Abstract

Semantische Bildsegmentierung ist eine grundlegende Aufgabe zur Szenenverstehung in Straßenumgebungen im Kontext autonomer Fahrzeuge, bei der jeder Pixel eines hochaufgelösten Bildes einer Menge semantischer Klassen zugeordnet wird. Im Gegensatz zu anderen Szenarien weisen Objekte in Straßenumgebungen sehr große Skalenveränderungen auf, was erhebliche Herausforderungen für die Darstellung hochwertiger Merkmale darstellt, da informationsreiche mehrskalige Informationen korrekt kodiert werden müssen. Um dieses Problem zu lösen, wurde die atrous-Konvolution eingeführt, um Merkmale mit größerem Rezeptivfeld zu generieren, ohne die räumliche Auflösung zu beeinträchtigen. Aufbauend auf der atrous-Konvolution wurde das Atrous Spatial Pyramid Pooling (ASPP) vorgeschlagen, das mehrere atrous-konvolvierte Merkmale mit unterschiedlichen Dilatationsraten zusammenschaltet, um eine endgültige Merkmalsdarstellung zu erzeugen. Obwohl ASPP in der Lage ist, mehrskalige Merkmale zu generieren, argumentieren wir, dass die Merkmalsauflösung entlang der Skalenebene im Kontext autonomer Fahrzeuge nicht dicht genug ist. Daher schlagen wir Densely connected Atrous Spatial Pyramid Pooling (DenseASPP) vor, bei dem eine Reihe von atrous-Konvolutionsschichten dicht miteinander verbunden sind, sodass mehrskalige Merkmale generiert werden, die nicht nur einen größeren Skalenbereich abdecken, sondern diesen Bereich auch dichter abdecken, ohne die Modellgröße signifikant zu erhöhen. Wir evaluieren DenseASPP am Straßen-Szenen-Benchmark Cityscapes und erreichen dabei einen Stand der Technik (state-of-the-art)-Leistungswert.