HyperAIHyperAI
vor einem Monat

MicronNet: Eine hochkompakte Deep Convolutional Neural Network Architektur für die Echtzeit-Klassifizierung von Verkehrsschildern in eingebetteten Systemen

Alexander Wong; Mohammad Javad Shafiee; Michael St. Jules
MicronNet: Eine hochkompakte Deep Convolutional Neural Network Architektur für die Echtzeit-Klassifizierung von Verkehrsschildern in eingebetteten Systemen
Abstract

Die Erkennung von Verkehrszeichen ist eine sehr wichtige Aufgabe der Computer Vision für zahlreiche Anwendungen in der realen Welt, wie z.B. intelligente Verkehrsaufsicht und -analyse. Obwohl tiefgreifende Neuronale Netze in den letzten Jahren als Stand der Technik bei der Erkennung von Verkehrszeichen bewiesen wurden, stellt die hohe Rechenleistung und Speicheranforderungen solcher Netze eine wesentliche Herausforderung für die weitreichende Einführung von tiefen neuronalen Netzen in eingebettete Systeme dar. Daher bietet es sich an, kompakte Architekturen tiefgreifender Neuronaler Netze für die Erkennung von Verkehrszeichen zu untersuchen, die besser für eingebettete Geräte geeignet sind. In dieser Arbeit stellen wir MicronNet vor, ein hochgradig kompaktes tiefes Faltungsneuronales Netzwerk zur Echtzeit-Erkennung von Verkehrszeichen, das auf Makroarchitektur-Designprinzipien (z.B. spektrale Makroarchitekturaugmentierung, Optimierung der Parametergenauigkeit usw.) sowie numerischen Mikroarchitekturoptimierungsstrategien basiert. Die resultierende Gesamtarchitektur von MicronNet wurde daher so konzipiert, dass sie mit möglichst wenigen Parametern und Berechnungen auskommt, während gleichzeitig die Erkennungsleistung gewährleistet wird. Dies führt zu einer optimierten Informationsdichte des vorgeschlagenen Netzwerks. Das resultierende MicronNet verfügt über eine Modellgröße von nur etwa 1 MB und etwa 510.000 Parametern (ca. 27-mal weniger Parameter als der aktuelle Stand der Technik), wobei es trotzdem eine menschliche Top-1-Akkuranz von 98,9 % im deutschen Benchmark zur Verkehrszeichenerkennung erreicht. Darüber hinaus benötigt MicronNet nur etwa 10 Millionen Multiplizieren-Akkumulieren-Operationen zur Inferenz und hat eine Berechnungszeit von nur 32,19 ms auf einem Cortex-A53 Hocheffizienzprozessor. Diese experimentellen Ergebnisse zeigen, dass hochgradig kompakte und optimierte Architekturen tiefgreifender Neuronaler Netze für die Echtzeit-Erkennung von Verkehrszeichen entwickelt werden können, die gut für eingebettete Szenarien geeignet sind.

MicronNet: Eine hochkompakte Deep Convolutional Neural Network Architektur für die Echtzeit-Klassifizierung von Verkehrsschildern in eingebetteten Systemen | Neueste Forschungsarbeiten | HyperAI