Command Palette
Search for a command to run...
Semantische Instanzsegmentierung mit einer diskriminativen Verlustfunktion
Semantische Instanzsegmentierung mit einer diskriminativen Verlustfunktion
De Brabandere Bert Neven Davy Van Gool Luc
Zusammenfassung
Die semantische Instanzsegmentierung bleibt eine herausfordernde Aufgabe. In dieser Arbeit schlagen wir vor, das Problem mit einer diskriminativen Verlustfunktion anzugehen, die auf Pixel-Ebene operiert und ein konvolutionales Netzwerk dazu anregt, eine Darstellung der Bildinformation zu erzeugen, die sich durch einen einfachen Nachbearbeitungsschritt leicht in Instanzen clusterbar macht. Die Verlustfunktion fördert dabei, dass das Netzwerk jeden Pixel auf einen Punkt im Merkmalsraum abbildet, sodass Pixel derselben Instanz eng beieinander liegen, während verschiedene Instanzen durch einen großen Abstand voneinander getrennt sind. Unser Ansatz, ein kommerziell verfügbares Netzwerk mit einer begründeten Verlustfunktion zu kombinieren, die sich an einem metrischen Lernziel orientiert, ist konzeptionell einfach und unterscheidet sich deutlich von jüngeren Ansätzen zur Instanzsegmentierung. Im Gegensatz zu früheren Arbeiten basiert unsere Methode nicht auf Objektvorschlägen oder rekurrenten Mechanismen. Ein zentraler Beitrag unserer Arbeit besteht darin, zu zeigen, dass eine solche einfache Architektur ohne zusätzliche Komplexitäten wirksam ist und mit aufwändigeren Methoden konkurrieren kann. Darüber hinaus zeigen wir, dass sie einige der Einschränkungen der gängigen „detect-and-segment“-Ansätze nicht aufweist. Wir erzielen wettbewerbsfähige Ergebnisse auf den Benchmarks Cityscapes und CVPPP für Blattsegmentierung.