HyperAIHyperAI
il y a 17 jours

Séparation continue de paroles avec Conformer

Sanyuan Chen, Yu Wu, Zhuo Chen, Jian Wu, Jinyu Li, Takuya Yoshioka, Chengyi Wang, Shujie Liu, Ming Zhou
Séparation continue de paroles avec Conformer
Résumé

La séparation de parole continue joue un rôle essentiel dans des tâches complexes liées à la parole, telles que la transcription de conversations. Le modèle de séparation extrait un signal provenant d’un seul locuteur à partir d’un mélange de paroles. Dans cet article, nous utilisons des transformateurs et des conformers à la place des réseaux de neurones récurrents dans le système de séparation, car nous estimons qu’extraire des informations globales grâce à une méthode basée sur l’attention auto-attentive est cruciale pour la séparation de parole. Évalués sur le jeu de données LibriCSS, le modèle de séparation basé sur le conformer atteint des résultats de pointe, avec une réduction relative de 23,5 % du taux d’erreur mot (WER) par rapport au modèle BLSTM (LSTM bidirectionnel) lors de l’évaluation par énoncé, et une réduction de 15,4 % en évaluation continue.