HyperAIHyperAI

Command Palette

Search for a command to run...

Le système de reconnaissance vocale conversationnelle téléphonique IBM 2015

George Saon Hong-Kwang J. Kuo Steven Rennie Michael Picheny

Résumé

Nous décrivons les dernières améliorations apportées au système de reconnaissance de la parole téléphonique conversationnelle en anglais d'IBM. Parmi les techniques qui se sont révélées bénéfiques, on peut citer : les réseaux maxout avec des taux de dropout refroidis ; des réseaux disposant d'un très grand nombre de sorties formés sur 2000 heures de données ; la modélisation conjointe de réseaux neuronaux récurrents partiellement déroulés et de réseaux convolutifs en combinant les couches bottleneck et de sortie, puis en retitrainant le modèle résultant ; et enfin, un recalage sophistiqué des modèles de langage avec des modèles exponentiels et des modèles de langage basés sur des réseaux neuronaux (LMs). Ces techniques ont permis d'obtenir un taux d'erreur de mots de 8,0 % sur la partie Switchboard du jeu de tests d'évaluation Hub5-2000, ce qui représente une amélioration relative de 23 % par rapport à notre meilleur résultat publié précédemment.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Le système de reconnaissance vocale conversationnelle téléphonique IBM 2015 | Articles | HyperAI