Verbessertes Grenzflächen-Lernen für die Segmentierung von glasartigen Objekten

Glasartige Objekte wie Fenster, Flaschen und Spiegel sind in der realen Welt weit verbreitet. Die Erkennung solcher Objekte besitzt zahlreiche Anwendungen, beispielsweise in der Roboternavigation und Objektgriff. Aufgrund der beliebigen Szenen hinter glasartigen Objekten stellt diese Aufgabe jedoch eine erhebliche Herausforderung dar. In dieser Arbeit wird das Problem der Segmentierung glasartiger Objekte durch verbessertes Randlern angegangen. Insbesondere stellen wir zunächst einen neuartigen verfeinerten Differenzialmodul vor, der feinere Randinformationen generiert. Anschließend führen wir einen kantenbewussten, punktbasierten Graphen-Convolution-Netzwerk-Modul ein, um die globale Form entlang der Objektränder zu modellieren. Diese beiden Module werden genutzt, um einen Decoder zu entwerfen, der präzise und saubere Segmentierungsergebnisse liefert, insbesondere entlang der Objektkonturen. Beide Module sind leichtgewichtig und effektiv und können nahtlos in verschiedene Segmentierungsmodelle integriert werden. In umfangreichen Experimenten auf drei aktuellen Datensätzen zur Segmentierung glasartiger Objekte – Trans10k, MSD und GDD – erreicht unser Ansatz neue State-of-the-Art-Ergebnisse. Zudem demonstrieren wir die starke Verallgemeinerungsfähigkeit unserer Methode auf drei allgemeinen Segmentierungsdatensätzen: Cityscapes, BDD und COCO Stuff. Der Quellcode und die Modelle sind unter \url{https://github.com/hehao13/EBLNet} verfügbar.