Command Palette
Search for a command to run...
Sur la généralisation des filtres pour l'extension de bande passante musicale à l'aide de réseaux neuronaux profonds
Sur la généralisation des filtres pour l'extension de bande passante musicale à l'aide de réseaux neuronaux profonds
Serkan Sulun Matthew E. P. Davies
Résumé
Dans cet article, nous abordons un sous-thème du vaste domaine de l'amélioration audio, à savoir l'extension de bande audio musicale. Nous formulons le problème d'extension de bande en utilisant des réseaux neuronaux profonds, où un signal à bande limitée est fourni en entrée au réseau, avec pour objectif de reconstruire une sortie à bande complète. Notre contribution principale porte sur l'impact du choix du filtre passe-bas lors de l'entraînement et des tests ultérieurs du réseau.Pour deux architectures profondes d'avant-garde, ResNet et U-Net, nous démontrons que lorsque les filtres utilisés pour l'entraînement et les tests sont identiques, des améliorations du rapport signal-bruit (SNR) pouvant atteindre 7 dB peuvent être obtenues. Cependant, lorsque ces filtres diffèrent, l'amélioration diminue considérablement et dans certaines conditions d'entraînement, elle peut même entraîner un SNR inférieur à celui du signal à bande limitée en entrée. Pour contourner ce phénomène apparent de surapprentissage par rapport à la forme du filtre, nous proposons une stratégie d'augmentation de données qui utilise plusieurs filtres passe-bas pendant l'entraînement et conduit à une meilleure généralisation aux conditions de filtrage inconnues lors des tests.