HyperAIHyperAI

Command Palette

Search for a command to run...

MatchboxNet : Architecture de réseau de neurones convolutionnel 1D séparable temps-canalaire pour la reconnaissance de commandes vocales

Somshubra Majumdar Boris Ginsburg

Résumé

Nous présentons MatchboxNet, un réseau neuronal end-to-end pour la reconnaissance de commandes vocales. MatchboxNet est un réseau résiduel profond composé de blocs de convolution 1D séparable dans le temps et le canal, suivis de couches de normalisation par lot, de fonctions d'activation ReLU et de couches de dropout. MatchboxNet atteint une précision de pointe sur le jeu de données Google Speech Commands tout en disposant d'un nombre de paramètres significativement réduit par rapport à des modèles similaires. La faible empreinte de MatchboxNet en fait un candidat particulièrement attrayant pour les dispositifs à ressources computationnelles limitées. Le modèle est hautement évolutif, permettant d’améliorer sa précision avec une augmentation modeste de la mémoire et des ressources de calcul. Enfin, nous montrons comment une augmentation de données intensive, utilisant un ensemble de bruit auxiliaire, améliore la robustesse du modèle en présence de bruit ambiant.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
MatchboxNet : Architecture de réseau de neurones convolutionnel 1D séparable temps-canalaire pour la reconnaissance de commandes vocales | Articles | HyperAI