HyperAIHyperAI
vor 16 Tagen

Deep Hough Transform für die semantische Linienerkennung

Kai Zhao, Qi Han, Chang-Bin Zhang, Jun Xu, Ming-Ming Cheng
Deep Hough Transform für die semantische Linienerkennung
Abstract

Wir konzentrieren uns auf eine grundlegende Aufgabe: die Erkennung sinnvoller Linienstrukturen, auch semantische Linien genannt, in natürlichen Szenen. Viele bisherige Methoden betrachten dieses Problem als Sonderfall der Objekterkennung und passen bestehende Objektdetektoren für die semantische Linienerkennung an. Diese Ansätze vernachlässigen jedoch die inhärenten Eigenschaften von Linien, was zu suboptimalen Ergebnissen führt. Im Gegensatz zu komplexen Objekten weisen Linien eine erheblich einfachere geometrische Struktur auf und können daher kompakt durch wenige Parameter beschrieben werden. Um diese Eigenschaft von Linien besser auszunutzen, integrieren wir in diesem Artikel die klassische Hough-Transformation in tief gelernte Darstellungen und stellen einen einstufigen, end-to-end lernbaren Rahmen für die Linienerkennung vor. Durch die Parameterisierung von Linien mittels Steigung und Achsenabschnitt führen wir die Hough-Transformation durch, um tiefe Darstellungen in den parametrischen Raum zu transformieren, in dem dann die Linienerkennung erfolgt. Konkret aggregieren wir Merkmale entlang möglicher Linien in der Merkmalskarten-Ebene und weisen die aggregierten Merkmale den entsprechenden Positionen im parametrischen Raum zu. Dadurch wird das Problem der Erkennung semantischer Linien im räumlichen Raum in das Problem der Erkennung einzelner Punkte im parametrischen Raum transformiert, wodurch die nachfolgenden Verarbeitungsschritte, insbesondere die Nicht-Maximal-Unterdrückung, effizienter werden. Darüber hinaus ermöglicht unsere Methode die einfache Extraktion kontextueller Linienmerkmale, beispielsweise Merkmale entlang von Linien in der Nähe einer bestimmten Linie, die für eine präzise Linienerkennung entscheidend sind. Neben der vorgeschlagenen Methode entwickeln wir außerdem eine Evaluationsmetrik zur Beurteilung der Qualität der Linienerkennung und erstellen eine großskalige Datensammlung für die Aufgabe der Linienerkennung. Experimentelle Ergebnisse auf unserer vorgeschlagenen Datensammlung sowie einer weiteren öffentlichen Datensammlung belegen die Überlegenheit unserer Methode gegenüber vorherigen State-of-the-Art-Verfahren.

Deep Hough Transform für die semantische Linienerkennung | Neueste Forschungsarbeiten | HyperAI