il y a 6 mois

Résumé

Nous décrivons une fonction de perte dans le domaine de la modulation pour les systèmes d’amélioration de parole basés sur l’apprentissage profond. Des champs réceptifs spectro-temporels (STRFs) ajustables ont été adaptés afin d’optimiser une tâche d’identification de locuteur. Ces STRFs appris ont ensuite été utilisés pour calculer un erreur quadratique moyenne pondérée (MSE) dans le domaine de la modulation, afin d’entraîner un système d’amélioration de parole. Des expériences ont montré qu’en ajoutant la perte MSE dans le domaine de la modulation à la perte MSE dans le domaine spectro-temporel, la prédiction objective de la qualité et de l’intelligibilité de la parole est significativement améliorée pour les systèmes d’amélioration en temps réel, sans engendrer de coût computationnel supplémentaire lors de l’inférence.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traitement Audio Et Vocal

Apprentissage Multi-tâches

Réseau De Neurones Convolutif

Approche/Framework

Audio

Tâche

Tyler Vuong Yangyang Xia Richard M. Stern

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traitement Audio Et Vocal

Apprentissage Multi-tâches

Réseau De Neurones Convolutif

Approche/Framework

Audio

Tâche

Tyler Vuong Yangyang Xia Richard M. Stern

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Une perte dans le domaine de la modulation pour une amélioration en temps réel du speech basée sur les réseaux de neurones | Articles | HyperAI

Command Palette

Une perte dans le domaine de la modulation pour une amélioration en temps réel du speech basée sur les réseaux de neurones

Tyler Vuong Yangyang Xia Richard M. Stern

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Une perte dans le domaine de la modulation pour une amélioration en temps réel du speech basée sur les réseaux de neurones

Tyler Vuong Yangyang Xia Richard M. Stern

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Une perte dans le domaine de la modulation pour une amélioration en temps réel du speech basée sur les réseaux de neurones

Tyler Vuong Yangyang Xia Richard M. Stern

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters