HyperAIHyperAI
il y a 2 mois

Le système de reconnaissance vocale conversationnelle téléphonique IBM 2015

George Saon; Hong-Kwang J. Kuo; Steven Rennie; Michael Picheny
Le système de reconnaissance vocale conversationnelle téléphonique IBM 2015
Résumé

Nous décrivons les dernières améliorations apportées au système de reconnaissance de la parole téléphonique conversationnelle en anglais d'IBM. Parmi les techniques qui se sont révélées bénéfiques, on peut citer : les réseaux maxout avec des taux de dropout refroidis ; des réseaux disposant d'un très grand nombre de sorties formés sur 2000 heures de données ; la modélisation conjointe de réseaux neuronaux récurrents partiellement déroulés et de réseaux convolutifs en combinant les couches bottleneck et de sortie, puis en retitrainant le modèle résultant ; et enfin, un recalage sophistiqué des modèles de langage avec des modèles exponentiels et des modèles de langage basés sur des réseaux neuronaux (LMs). Ces techniques ont permis d'obtenir un taux d'erreur de mots de 8,0 % sur la partie Switchboard du jeu de tests d'évaluation Hub5-2000, ce qui représente une amélioration relative de 23 % par rapport à notre meilleur résultat publié précédemment.

Le système de reconnaissance vocale conversationnelle téléphonique IBM 2015 | Articles de recherche récents | HyperAI