DeepFlux für Skelette im Freien

Die Berechnung von Objektskeletten in natürlichen Bildern ist aufgrund der großen Variationen in der Objektanmutung und -skalierung sowie der Komplexität der Hintergrundstörungen herausfordernd. Viele aktuelle Methoden formulieren die Objektskeletterkennung als ein binäres Pixelklassifikationsproblem, was im Prinzip vergleichbar ist mit lernbasierten Kantenerkennungsverfahren und semantischen Segmentierungsverfahren. Im vorliegenden Artikel weichen wir von dieser Strategie ab, indem wir ein CNN trainieren, um ein zweidimensionales Vektorfeld vorherzusagen, das jeden Szenenpunkt einem potenziellen Skelett-Pixel zuordnet, ähnlich den flux-basierten Skeletterkennungsalgorithmen (flux-based skeletonization algorithms). Diese "Bildkontext-Fluss" (image context flux) Darstellung hat gegenüber früheren Ansätzen zwei wesentliche Vorteile. Erstens kodiert sie explizit die relative Position von Skelett-Pixels zu semantisch bedeutsamen Entitäten, wie z.B. den Bildpunkten in ihrem räumlichen Kontext und damit auch die implizierten Objektgrenzen. Zweitens kann das regionale Vektorfeld des Skeletterkennungskontexts besser mit Objektteilen großer Breite umgehen. Wir evaluieren das vorgeschlagene Verfahren anhand dreier Benchmark-Datensätze für Skeletterkennung und zweier für Symmetrierkennung, wobei es konsistent überlegen an den aktuellen Methoden abschneidet.