HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux Neuronaux Récursifs Profonds pour la Modélisation Acoustique

William Chan Ian Lane

Résumé

Nous présentons un nouveau modèle de Réseau Neuronal Récurent (RNN) profond pour la modélisation acoustique dans le domaine de la Reconnaissance Automatique de la Parole (ASR). Nous nommons notre contribution le modèle TC-DNN-BLSTM-DNN, qui combine un Réseau Neuronal Profond (DNN) avec une Convolution Temporelle (TC), suivi d'une Mémoire à Court et Long Terme Bidirectionnelle (BLSTM), et un dernier DNN. Le premier DNN agit comme processeur de caractéristiques pour notre modèle, la BLSTM génère ensuite un contexte à partir du signal acoustique séquentiel, et le dernier DNN prend ce contexte en entrée pour modéliser les probabilités a posteriori des états acoustiques. Nous obtenons un taux d'erreur de reconnaissance (WER) de 3,47 % sur la tâche eval92 du Wall Street Journal (WSJ), soit une amélioration relative supérieure à 8 % par rapport aux modèles DNN de base.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Réseaux Neuronaux Récursifs Profonds pour la Modélisation Acoustique | Articles | HyperAI