Bidirektionales Kaskaden Netzwerk für perzeptive Kantenerkennung

Die Nutzung von mehrskaligen Darstellungen ist entscheidend, um die Kantenerkennung für Objekte unterschiedlicher Größen zu verbessern. Um Kanten bei stark unterschiedlichen Skalen zu extrahieren, schlagen wir eine bidirektionale Kaskadenstruktur (Bi-Directional Cascade Network, BDCN) vor, bei der jede Schicht durch etikettierte Kanten auf ihrer spezifischen Skala überwacht wird, anstatt die gleiche Überwachung direkt auf alle CNN-Ausgaben anzuwenden. Des Weiteren, um die von der BDCN gelernten mehrskaligen Darstellungen zu bereichern, führen wir ein Skalenverbesserungsmodul (Scale Enhancement Module, SEM) ein, das erweiterte Faltungen verwendet, um mehrskalige Merkmale zu generieren, anstatt tiefer gehende CNNs oder explizite Fusionierung von mehrskaligen Kantenkarten zu nutzen. Diese neuen Ansätze fördern das Lernen von mehrskaligen Darstellungen in verschiedenen Schichten und erkennen Kanten, die gut durch ihre Skalen definiert sind. Das Lernen von skalenbezogenen Schichten führt auch zu einem kompakten Netzwerk mit nur einem Bruchteil der Parameter. Wir evaluieren unsere Methode anhand dreier Datensätze: BSDS500, NYUDv2 und Multicue. Dabei erreichen wir einen ODS-F-Maßwert von 0.828, was 1.3 % höher ist als der aktuelle Stand der Technik im BSDS500-Datensatz. Der Code ist unter https://github.com/pkuCactus/BDCN verfügbar.