HyperAIHyperAI

Command Palette

Search for a command to run...

Une perte dans le domaine de la modulation pour une amélioration en temps réel du speech basée sur les réseaux de neurones

Tyler Vuong Yangyang Xia Richard M. Stern

Résumé

Nous décrivons une fonction de perte dans le domaine de la modulation pour les systèmes d’amélioration de parole basés sur l’apprentissage profond. Des champs réceptifs spectro-temporels (STRFs) ajustables ont été adaptés afin d’optimiser une tâche d’identification de locuteur. Ces STRFs appris ont ensuite été utilisés pour calculer un erreur quadratique moyenne pondérée (MSE) dans le domaine de la modulation, afin d’entraîner un système d’amélioration de parole. Des expériences ont montré qu’en ajoutant la perte MSE dans le domaine de la modulation à la perte MSE dans le domaine spectro-temporel, la prédiction objective de la qualité et de l’intelligibilité de la parole est significativement améliorée pour les systèmes d’amélioration en temps réel, sans engendrer de coût computationnel supplémentaire lors de l’inférence.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Une perte dans le domaine de la modulation pour une amélioration en temps réel du speech basée sur les réseaux de neurones | Articles | HyperAI