Rekurrente generische konturbasierte Instanzsegmentierung mit fortschreitendem Lernen

Die konturbasierte Instanzsegmentierung wurde aufgrund ihrer Flexibilität und Eleganz bei der Verarbeitung visueller Objekte in komplexen Hintergründen intensiv erforscht. In dieser Arbeit stellen wir eine neuartige tief neuronale Architektur, die sogenannte PolySnake, für die generische konturbasierte Instanzsegmentierung vor. Angeregt durch den klassischen Snake-Algorithmus erreicht die vorgeschlagene PolySnake durch eine iterative und fortschreitende Konturrefinierung eine herausragende und robuste Segmentierungsgenauigkeit. Technisch betrachtet führt PolySnake einen rekurrenten Aktualisierungsoperator ein, um die Objektkontur iterativ zu schätzen. Dabei wird eine einzige Konturentscheidung aufrechterhalten, die schrittweise in Richtung der Objektkontur deformiert wird. In jeder Iteration erstellt PolySnake eine semantisch reichhaltige Darstellung der aktuellen Kontur und liefert diese dem rekurrenten Operator zur weiteren Anpassung der Kontur. Durch die iterative Verbesserung konvergiert die Kontur schließlich zu einem stabilen Zustand, der das Objekt exakt umschließt. Neben der allgemeinen Instanzsegmentierung werden umfangreiche Experimente durchgeführt, um die Wirksamkeit und Allgemeingültigkeit von PolySnake in zwei zusätzlichen spezifischen Anwendungsszenarien zu validieren: Szenentexterkennung und Fahrspurerkennung. Die Ergebnisse zeigen, dass die vorgeschlagene PolySnake gegenüber bestehenden fortschrittlichen Methoden auf mehreren etablierten Benchmarks in allen drei Aufgaben eine überlegene Leistung erzielt. Der Quellcode und vortrainierte Modelle sind unter https://github.com/fh2019ustc/PolySnake verfügbar.