HyperAIHyperAI
vor 17 Tagen

Dichte Decoder-Verknüpfungen für die Einzelpass-Semantische Segmentierung

{Victor Prisacariu, Piotr Bilinski}
Dichte Decoder-Verknüpfungen für die Einzelpass-Semantische Segmentierung
Abstract

Wir stellen eine neuartige, end-to-end trainierbare, tiefe Encoder-Decoder-Architektur für die Einzelpass-Semantiksegmentierung vor. Unser Ansatz basiert auf einer kaskadierten Architektur mit Merkmalslevel-Long-Range-Skip-Verbindungen. Der Encoder nutzt die Struktur der ResNeXt-Residual-Bausteine und implementiert die Strategie, einen Baustein wiederholt zu verwenden, der eine Menge von Transformationen mit identischer Topologie aggregiert. Der Decoder verfügt über eine neuartige Architektur aus Blöcken, die (i) Kontextinformationen erfassen, (ii) semantische Merkmale erzeugen und (iii) eine Fusion zwischen unterschiedlichen Ausgabemodi ermöglichen. Entscheidend ist, dass wir dichte Decoder-Skip-Verbindungen einführen, um den Decoder-Blöcken zu erlauben, semantische Merkmalskarten aus allen vorherigen Decoder-Ebenen – also aus allen höheren Merkmalskarten – zu nutzen. Diese dichten Decoder-Verbindungen ermöglichen eine effektive Informationsweiterleitung zwischen den Decoder-Blöcken sowie eine mehrstufige Merkmalsfusion, die die Genauigkeit erheblich verbessert. Wichtig ist, dass unsere Methode auf mehreren anspruchsvollen Datensätzen eine state-of-the-art-Leistung erzielt, ohne die zeitaufwendige Multi-Skala-Averaging-Strategie früherer Ansätze zu benötigen.