HyperAIHyperAI
il y a 3 mois

CleanUNet 2 : un modèle hybride d’annulation du bruit vocal sur forme d’onde et spectrogramme

Zhifeng Kong, Wei Ping, Ambrish Dantrey, Bryan Catanzaro
CleanUNet 2 : un modèle hybride d’annulation du bruit vocal sur forme d’onde et spectrogramme
Résumé

Dans ce travail, nous présentons CleanUNet 2, un modèle de débruitage vocal qui combine les avantages des débruiteurs de forme d’onde et des débruiteurs de spectrogramme, réalisant ainsi le meilleur des deux mondes. CleanUNet 2 repose sur un cadre en deux étapes inspiré des méthodes populaires de synthèse vocale, qui intègrent un modèle de forme d’onde et un modèle de spectrogramme. Plus précisément, CleanUNet 2 s’appuie sur CleanUNet, le débruiteur de forme d’onde d’état de l’art, et améliore encore ses performances en utilisant comme entrée les spectrogrammes prédits par un débruiteur de spectrogramme. Nous démontrons que CleanUNet 2 surpasser les méthodes antérieures sur diverses évaluations objectives et subjectives.