Tiefe Wasserscheidentransformation für die Instanzsegmentierung

Die meisten aktuellen Ansätze zur Instanzsegmentierung verwenden komplexe Pipelines, die bedingte Markowfelder (conditional random fields), rekurrente Neuronale Netze, Objektvorschläge oder Template-Matching-Verfahren beinhalten. In unserem Paper stellen wir ein einfaches, aber leistungsfähiges End-to-End-Faltungss neuronales Netzwerk vor, das diese Aufgabe bewältigt. Unser Ansatz kombiniert Erkenntnisse aus der klassischen Watershed-Transformation und modernem Deep Learning, um eine Energiemappe des Bildes zu erzeugen, in der Objektinstanzen eindeutig als Becken in der Energiemappe dargestellt werden. Anschließend führen wir einen Schnitt auf einem einzelnen Energielevel durch, um direkt zusammenhängende Komponenten zu erhalten, die den Objektinstanzen entsprechen. Unser Modell verdoppelt die Leistung des aktuellen Standes der Technik bei der anspruchsvollen Cityscapes Instanz-Level-Segmentierungsaufgabe mehr als das Zwei-fache.