HyperAIHyperAI

Command Palette

Search for a command to run...

MicronNet: Eine hochkompakte Deep Convolutional Neural Network Architektur für die Echtzeit-Klassifizierung von Verkehrsschildern in eingebetteten Systemen

Alexander Wong; Mohammad Javad Shafiee; Michael St. Jules

Zusammenfassung

Die Erkennung von Verkehrszeichen ist eine sehr wichtige Aufgabe der Computer Vision für zahlreiche Anwendungen in der realen Welt, wie z.B. intelligente Verkehrsaufsicht und -analyse. Obwohl tiefgreifende Neuronale Netze in den letzten Jahren als Stand der Technik bei der Erkennung von Verkehrszeichen bewiesen wurden, stellt die hohe Rechenleistung und Speicheranforderungen solcher Netze eine wesentliche Herausforderung für die weitreichende Einführung von tiefen neuronalen Netzen in eingebettete Systeme dar. Daher bietet es sich an, kompakte Architekturen tiefgreifender Neuronaler Netze für die Erkennung von Verkehrszeichen zu untersuchen, die besser für eingebettete Geräte geeignet sind. In dieser Arbeit stellen wir MicronNet vor, ein hochgradig kompaktes tiefes Faltungsneuronales Netzwerk zur Echtzeit-Erkennung von Verkehrszeichen, das auf Makroarchitektur-Designprinzipien (z.B. spektrale Makroarchitekturaugmentierung, Optimierung der Parametergenauigkeit usw.) sowie numerischen Mikroarchitekturoptimierungsstrategien basiert. Die resultierende Gesamtarchitektur von MicronNet wurde daher so konzipiert, dass sie mit möglichst wenigen Parametern und Berechnungen auskommt, während gleichzeitig die Erkennungsleistung gewährleistet wird. Dies führt zu einer optimierten Informationsdichte des vorgeschlagenen Netzwerks. Das resultierende MicronNet verfügt über eine Modellgröße von nur etwa 1 MB und etwa 510.000 Parametern (ca. 27-mal weniger Parameter als der aktuelle Stand der Technik), wobei es trotzdem eine menschliche Top-1-Akkuranz von 98,9 % im deutschen Benchmark zur Verkehrszeichenerkennung erreicht. Darüber hinaus benötigt MicronNet nur etwa 10 Millionen Multiplizieren-Akkumulieren-Operationen zur Inferenz und hat eine Berechnungszeit von nur 32,19 ms auf einem Cortex-A53 Hocheffizienzprozessor. Diese experimentellen Ergebnisse zeigen, dass hochgradig kompakte und optimierte Architekturen tiefgreifender Neuronaler Netze für die Echtzeit-Erkennung von Verkehrszeichen entwickelt werden können, die gut für eingebettete Szenarien geeignet sind.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp