HyperAIHyperAI
vor 2 Monaten

LinkNet: Nutzung von Encoder-Darstellungen für effiziente semantische Segmentierung

Abhishek Chaurasia; Eugenio Culurciello
LinkNet: Nutzung von Encoder-Darstellungen für effiziente semantische Segmentierung
Abstract

Die pixelweise semantische Segmentierung zur visuellen Szeneanalyse muss nicht nur genau sein, sondern auch effizient, um in Echtzeitanwendungen praktikabel zu sein. Obwohl existierende Algorithmen genaue Ergebnisse liefern, legen sie den Fokus nicht auf die effiziente Nutzung der Parameter neuronaler Netze. Als Folge sind diese Algorithmen in Bezug auf die Anzahl der Parameter und Operationen sehr umfangreich und daher auch langsam. In dieser Arbeit schlagen wir eine neuartige Architektur für tiefe neuronale Netze vor, die es ermöglicht, ohne einen signifikanten Anstieg der Parameteranzahl zu lernen. Unser Netzwerk verwendet lediglich 11,5 Millionen Parameter und 21,2 Gigaflops für die Verarbeitung eines Bildes mit einer Auflösung von 3x640x360 Pixeln. Es erzielt Stand-der-Technik-Leistungen im CamVid-Datensatz und vergleichbare Ergebnisse im Cityscapes-Datensatz. Zudem vergleichen wir die Verarbeitungszeit unseres Netzwerks auf einem NVIDIA-GPU und einem eingebetteten Systemgerät mit den bestehenden Stand-der-Technik-Architekturen für verschiedene Bildauflösungen.

LinkNet: Nutzung von Encoder-Darstellungen für effiziente semantische Segmentierung | Neueste Forschungsarbeiten | HyperAI