HyperAIHyperAI

Command Palette

Search for a command to run...

Séparation vocale avec un nombre inconnu de locuteurs multiples

Eliya Nachmani Yossi Adi Lior Wolf

Résumé

Nous présentons une nouvelle méthode de séparation d'une séquence audio mixée, dans laquelle plusieurs voix parlent simultanément. La méthode proposée utilise des réseaux neuronaux à portes entraînés pour séparer les voix à plusieurs étapes de traitement, tout en maintenant le locuteur associé à chaque canal de sortie fixe. Un modèle distinct est entraîné pour chaque nombre possible de locuteurs, et le modèle correspondant au plus grand nombre de locuteurs est utilisé pour estimer le nombre réel de locuteurs présents dans un échantillon donné. Notre méthode surpasse de manière significative l'état de l'art actuel, qui, comme nous le démontrons, n'est pas compétitif lorsqu'il y a plus de deux locuteurs.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Séparation vocale avec un nombre inconnu de locuteurs multiples | Articles | HyperAI