HyperAIHyperAI
il y a 16 jours

KUIELab-MDX-Net : Un réseau neuronal à deux flux pour le démixage musical

Minseok Kim, Woosung Choi, Jaehwa Chung, Daewon Lee, Soonyoung Jung
KUIELab-MDX-Net : Un réseau neuronal à deux flux pour le démixage musical
Résumé

Récemment, de nombreuses méthodes fondées sur l’apprentissage profond ont été proposées pour la séparation des sources musicales. Certaines méthodes de pointe ont montré que l’empilement de nombreuses couches associées à de nombreuses connexions de saut améliore significativement les performances en termes de SDR (Signal-to-Distortion Ratio). Bien que cette architecture profonde et complexe affiche des performances exceptionnelles, elle nécessite généralement des ressources informatiques importantes ainsi qu’un temps considérable pour l’entraînement et l’évaluation. Ce papier présente un réseau neuronal à deux flux pour la démixage musical, appelé KUIELab-MDX-Net, qui offre un bon compromis entre performance et consommation de ressources. Le modèle proposé comporte une branche temps-fréquence et une branche temps, chacune séparant indépendamment les pistes. Les résultats des deux flux sont ensuite combinés pour produire l’estimation finale. KUIELab-MDX-Net a obtenu la deuxième place au classement A et la troisième place au classement B du défi de démixage musical organisé lors de l’ISMIR 2021. Ce travail présente également un résumé des résultats expérimentaux obtenus sur une autre base de données, MUSDB18. Le code source est disponible en ligne.

KUIELab-MDX-Net : Un réseau neuronal à deux flux pour le démixage musical | Articles de recherche récents | HyperAI