HyperAIHyperAI

Command Palette

Search for a command to run...

MatchboxNet: 1D Time-Channel-separable Convolutional Neural Network-Architektur für die Sprachbefehls-Erkennung

Somshubra Majumdar Boris Ginsburg

Zusammenfassung

Wir präsentieren MatchboxNet – ein end-to-end-neuronales Netzwerk für die Sprachbefehls-Erkennung. MatchboxNet ist ein tiefes Residual-Netzwerk, das aus Blöcken bestehend aus 1D-zeitkanal-separabler Faltung, Batch-Normalisierung, ReLU und Dropout-Layern aufgebaut ist. MatchboxNet erreicht einen Stand der Technik (state-of-the-art)-Genauigkeitswert auf dem Google Speech Commands-Datensatz, während es signifikant weniger Parameter als vergleichbare Modelle besitzt. Das geringe Speicherbedarf- und Rechenbedarf-Profil von MatchboxNet macht es zu einer attraktiven Wahl für Geräte mit begrenzten Rechenressourcen. Das Modell ist außerdem hoch skalierbar, sodass die Modellgenauigkeit mit nur geringfügigem zusätzlichen Speicher- und Rechenaufwand verbessert werden kann. Schließlich zeigen wir, wie eine intensive Daten-Augmentation mittels eines zusätzlichen Rausch-Datensatzes die Robustheit gegenüber Hintergrundrauschen erhöht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
MatchboxNet: 1D Time-Channel-separable Convolutional Neural Network-Architektur für die Sprachbefehls-Erkennung | Paper | HyperAI