HyperAIHyperAI
vor 17 Tagen

Zu Keyword Spotting auf Geräten unter Verwendung von niedrigflächigen Quaternion-Neuralmodellen

{Vinayak Abrol, Aryan Chaudhary}
Abstract

On-Device-Schlüsselworterkennung (Keyword Spotting, KWS) ist eine entscheidende Komponente für die Wachruffunktion und Benutzerinteraktion auf intelligenten Edge-Geräten. Bestehende Modelle mit geringem Speicherbedarf basieren hauptsächlich auf 1D- und 2D-Faltungen, wobei die 2D-Faltungen besser in der Erfassung von Invarianzen sind, während die 1D-Faltungen schnellere Inferenzzeiten ermöglichen. In dieser Arbeit untersuchen wir Quaternion-Neuronale Modelle als Alternative für eine effektive akustische Modellierung im KWS-Task. Quaternion-Modelle können verschiedene Aspekte der Eingabedaten innerhalb der mehrdimensionalen Quaternionenräume kodieren, was zu kompakteren und effizienteren Modellen führt im Vergleich zu herkömmlichen Ansätzen. Dies zeigen wir anhand quaternionaler Varianten bekannter KWS-Modelle auf dem Google Command V2-Datensatz, bei denen unsere Modelle eine vergleichbare Leistung wie bestehende Ansätze erzielen. Zudem liefern wir eine umfassende Analyse des Lernverhaltens in Quaternion-Netzwerken, um deren Einsatz in weiteren Sprach-/Audio-Aufgaben zu begründen.