Command Palette
Search for a command to run...
SwiDeN: Faltungsneuronale Netze für abbildungsinvariante Objekterkennung
SwiDeN: Faltungsneuronale Netze für abbildungsinvariante Objekterkennung
Sarvadevabhatla Ravi Kiran Surya Shiv Kruthiventi Srinivas S S R Venkatesh Babu
Zusammenfassung
Aktuelle State-of-the-Art-Architekturen für Objekterkennung erzielen beeindruckende Ergebnisse, sind jedoch typischerweise auf einen einzigen Darstellungsstil spezialisiert (z. B. ausschließlich Fotos oder ausschließlich Skizzen). In diesem Artikel stellen wir SwiDeN vor – unsere Architektur eines konvolutionellen neuronalen Netzwerks (CNN), das Objekte unabhängig von ihrer visuellen Darstellung (z. B. Strichzeichnung, realistisch schattiertes Zeichnen, Foto usw.) erkennt. In SwiDeN nutzen wir einen neuartigen, „tiefen“ auf dem Darstellungsstil basierenden Schaltmechanismus, der sowohl die stilabhängigen als auch die stilunabhängigen Aspekte des Erkennungsproblems angemessen berücksichtigt. Wir vergleichen SwiDeN mit alternativen Architekturen und früheren Ansätzen anhand eines 50-Kategorien-Datensatzes (Photo-Art), der Objekte in mehreren Darstellungsstilen enthält. Experimentelle Ergebnisse zeigen, dass SwiDeN andere Ansätze bei der stilunabhängigen Objekterkennung übertrifft.