HyperAIHyperAI

Command Palette

Search for a command to run...

Réseau LSTM à transformation de double signal pour la suppression en temps réel du bruit

Nils L. Westhausen Bernd T. Meyer

Résumé

Ce papier présente un réseau neuronal à mémoire à long terme à transformation de signaux duals (DTLN) pour l’amélioration en temps réel de la parole dans le cadre du Deep Noise Suppression Challenge (DNS-Challenge). Cette approche combine une transformation de Fourier à court terme (STFT) et une base d’analyse et de synthèse apprise dans une architecture en réseau empilé, avec moins d’un million de paramètres. Le modèle a été entraîné sur 500 heures de parole bruitée fournies par les organisateurs du défi. Le réseau est capable de traitement en temps réel (un cadre d’entrée, un cadre de sortie) et atteint des résultats compétitifs. La combinaison de ces deux types de transformations de signaux permet au DTLN d’extraire de manière robuste des informations à partir des spectres d’amplitude tout en intégrant des informations de phase issues de la base fonctionnelle apprise. La méthode obtient des performances de pointe et dépasse la référence du DNS-Challenge de 0,24 point en score moyen d’opinion (MOS).


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Réseau LSTM à transformation de double signal pour la suppression en temps réel du bruit | Articles | HyperAI