HyperAIHyperAI
vor 2 Monaten

Hallo Edge: Schlagworterkennung auf Mikrocontrollern

Yundong Zhang; Naveen Suda; Liangzhen Lai; Vikas Chandra
Hallo Edge: Schlagworterkennung auf Mikrocontrollern
Abstract

Schlüsselworterkennung (KWS) ist ein entscheidendes Element zur Aktivierung von sprachbasierten Benutzerinteraktionen auf Smart Devices. Sie erfordert eine Echtzeit-Antwort und hohe Genauigkeit, um eine gute Benutzererfahrung zu gewährleisten. In jüngerer Zeit sind neuronale Netze aufgrund ihrer überlegenen Genauigkeit im Vergleich zu traditionellen Sprachverarbeitungsalgorithmen eine attraktive Wahl für die Architektur von KWS-Systemen geworden. Aufgrund seiner ständig aktiven Natur hat die KWS-Anwendung ein stark eingeschränktes Energiebudget und läuft in der Regel auf Mikrocontrollern mit begrenztem Speicher und Rechenleistung. Die Gestaltung der neuronalen Netzarchitektur für KWS muss diese Einschränkungen berücksichtigen. In dieser Arbeit führen wir eine Bewertung und Exploration verschiedener neuronalen Netzarchitekturen durch, die für die Ausführung von KWS auf ressourcenbeschränkten Mikrocontrollern geeignet sind. Wir trainieren verschiedene in der Literatur veröffentlichte neuronale Netzarchitekturen für Schlüsselworterkennung, um ihre Genauigkeit und Speicher-/Rechenanforderungen zu vergleichen. Wir zeigen, dass es möglich ist, diese neuronalen Netzarchitekturen so zu optimieren, dass sie innerhalb der Speicher- und Rechenkapazitätsgrenzen von Mikrocontrollern passen, ohne dabei an Genauigkeit einzubüßen. Wir untersuchen ferner tiefgangig trennbare Faltungsneuronale Netze (DS-CNN) und vergleichen sie mit anderen neuronalen Netzarchitekturen. Das DS-CNN erreicht eine Genauigkeit von 95,4 %, was etwa 10 % höher ist als das DNN-Modell mit ähnlicher Anzahl von Parametern.