Extracteurs d'apprentissage métacognitif pour la séparation des sources musicales

Nous proposons un modèle hiérarchique inspiré par l’apprentissage métacognitif pour la séparation des sources musicales (Meta-TasNet), dans lequel un modèle générateur est utilisé pour prédire les poids des modèles extracteurs individuels. Cela permet un partage efficace des paramètres tout en maintenant une paramétrisation spécifique à chaque instrument. Meta-TasNet s’avère plus performant que les modèles entraînés de manière indépendante ou dans un cadre multi-tâches, tout en atteignant des performances comparables aux méthodes les plus avancées. En comparaison avec celles-ci, nos extracteurs comportent moins de paramètres et offrent des temps d’exécution plus rapides. Nous discutons des considérations architecturales importantes et explorons les coûts et les avantages de cette approche.