Reconnaissance Vocale
Reconnaissance vocaleC'est une technologie qui utilise des ordinateurs pour reconnaître la parole humaine. Elle couvre un large éventail de domaines et est étroitement liée à des disciplines telles que l’acoustique, la phonétique, la linguistique, la théorie de l’information, la théorie de la reconnaissance des formes et la neurobiologie.
Technologie de reconnaissance vocale grand public
- Déformation d'événement dynamique (DTW) : cet algorithme utilise la déformation dynamique pour combiner la relation de transformation temporelle afin d'obtenir la distance entre les vecteurs de caractéristiques. C'est un algorithme classique dans le domaine de la reconnaissance vocale.
- Modèle de Markov caché HMM : Le processus de prononciation est représenté par l'état dans la chaîne de Markov. Au cours du processus de génération de mots, le système passe d'un état à un autre et génère une sortie dans chaque état jusqu'à ce que le mot soit sorti.
- Réseau de neurones artificiels ANN : temps de formation long.
Difficultés de reconnaissance vocale
- Les performances de reconnaissance dépendent de l’environnement environnant. Lorsque l’environnement de formation n’est pas cohérent avec l’environnement de test, l’effet diminue.
- Problème de bruit, comment réduire efficacement le bruit ;
- L'ambiguïté des informations phonétiques, comme les mots ayant des prononciations similaires et les mots ayant la même prononciation mais des significations différentes.
Application de reconnaissance vocale
La reconnaissance vocale devient une technologie clé dans le domaine du traitement de l’information informatique. Son champ d'application comprend la numérotation vocale, la navigation vocale, le contrôle des équipements intérieurs, la récupération de documents vocaux, la saisie de données de dictée simple, etc. En intégrant d'autres technologies de traitement du langage naturel telles que la traduction automatique et la synthèse vocale, des applications plus complexes peuvent être créées, telles que la traduction entre les voix.