Command Palette
Search for a command to run...
SOLO: Objektssegmentierung basierend auf Positionen
SOLO: Objektssegmentierung basierend auf Positionen
Xinlong Wang Tao Kong Chunhua Shen Yuning Jiang Lei Li
Zusammenfassung
Wir präsentieren einen neuen, äußerst einfachen Ansatz zur Instanzsegmentierung in Bildern. Im Gegensatz zu vielen anderen Aufgaben der dichten Vorhersage, beispielsweise der semantischen Segmentierung, ist die beliebige Anzahl an Instanzen es, was die Instanzsegmentierung besonders herausfordernd macht. Um für jede Instanz eine Maske vorherzusagen, verfolgen etablierte Ansätze entweder die Strategie „zuerst detektieren, dann segmentieren“, wie sie beispielsweise bei Mask R-CNN angewendet wird, oder sie erstellen zunächst Kategoriemasken und wenden anschließend Clustering-Techniken an, um Pixel zu einzelnen Instanzen zu gruppieren. Wir betrachten die Aufgabe der Instanzsegmentierung nun aus einer völlig neuen Perspektive, indem wir den Begriff der „Instanzkategorien“ einführen, der jedem Pixel innerhalb einer Instanz aufgrund ihrer Position und Größe eine Kategorie zuweist. Auf diese Weise wird die Segmentierung von Instanzmasken elegant in ein klassifizierbares Problem transformiert. Die Instanzsegmentierung wird damit in zwei Klassifizierungsaufgaben zerlegt. Wir demonstrieren einen wesentlich einfacheren und flexibleren Framework für die Instanzsegmentierung mit hoher Leistungsfähigkeit, der eine vergleichbare Genauigkeit wie Mask R-CNN erreicht und kürzlich vorgestellte Ein-Schritt-Instanzsegmentierer in Bezug auf Genauigkeit übertreffen kann. Wir hoffen, dass dieses äußerst einfache und leistungsfähige Framework als Baseline für zahlreiche andere Aufgaben der Instanzerkennung jenseits der Instanzsegmentierung dienen kann.