HyperAIHyperAI

Command Palette

Search for a command to run...

Modèle d'attention pour la détection des caractéristiques articulatoires

Ievgen Karaulov; Dmytro Tkanov

Résumé

Les caractéristiques distinctives articulatoires ainsi que la transcription phonétique jouent un rôle important dans les tâches liées à la parole : formation à la prononciation assistée par ordinateur, conversion de texte en parole (TTS), étude des mécanismes de production de la parole, reconnaissance vocale pour les langues à ressources limitées. Les approches end-to-end ont connu une grande popularité ces dernières années dans le domaine des tâches liées à la parole. Nous appliquons l'architecture Listen, Attend and Spell (LAS) \cite{Chan-LAS2016} à la reconnaissance des phonèmes sur un petit ensemble d'apprentissage, comme TIMIT \cite{TIMIT-1992}. De plus, nous introduisons une nouvelle technique de décodage qui permet d'entraîner des détecteurs de modes et de lieux d'articulation de manière end-to-end en utilisant des modèles d'attention. Nous explorons également la reconnaissance conjointe des phonèmes et la détection des caractéristiques articulatoires dans un cadre d'apprentissage multitâche.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Modèle d'attention pour la détection des caractéristiques articulatoires | Articles | HyperAI