HyperAIHyperAI

Command Palette

Search for a command to run...

Séparation continue de paroles avec Conformer

Sanyuan Chen Yu Wu Zhuo Chen Jian Wu Jinyu Li Takuya Yoshioka Chengyi Wang Shujie Liu Ming Zhou

Résumé

La séparation de parole continue joue un rôle essentiel dans des tâches complexes liées à la parole, telles que la transcription de conversations. Le modèle de séparation extrait un signal provenant d’un seul locuteur à partir d’un mélange de paroles. Dans cet article, nous utilisons des transformateurs et des conformers à la place des réseaux de neurones récurrents dans le système de séparation, car nous estimons qu’extraire des informations globales grâce à une méthode basée sur l’attention auto-attentive est cruciale pour la séparation de parole. Évalués sur le jeu de données LibriCSS, le modèle de séparation basé sur le conformer atteint des résultats de pointe, avec une réduction relative de 23,5 % du taux d’erreur mot (WER) par rapport au modèle BLSTM (LSTM bidirectionnel) lors de l’évaluation par énoncé, et une réduction de 15,4 % en évaluation continue.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp