HyperAIHyperAI
il y a 15 jours

Séparation non supervisée de sources par inférence bayésienne dans le domaine latent

Michele Mancusi, Emilian Postolache, Giorgio Mariani, Marco Fumero, Andrea Santilli, Luca Cosmo, Emanuele Rodolà
Séparation non supervisée de sources par inférence bayésienne dans le domaine latent
Résumé

Les modèles d’isolement de sources audio de pointe reposent sur des approches supervisées fondées sur les données, qui peuvent s’avérer coûteuses en ressources d’étiquetage. À l’inverse, les méthodes permettant d’entraîner ces modèles sans aucune supervision directe sont généralement exigeantes en mémoire et en temps de calcul, et demeurent impraticables en phase d’inférence. Nous visons à surmonter ces limitations en proposant un algorithme d’isolement non supervisé simple mais efficace, opérant directement sur une représentation latente de signaux temporels. Notre approche s’appuie sur des prioris bayésiennes profondes sous la forme de réseaux autoregressifs préentraînés, afin de modéliser les distributions de probabilité de chaque source. En exploitant la faible cardinalité de l’espace latent discret, entraîné grâce à une nouvelle fonction de perte imposant une structure arithmétique précise, nous réalisons une inférence bayésienne exacte sans recourir à une stratégie d’approximation. Nous validons notre méthode sur le jeu de données Slakh (arXiv:1909.08494), obtenant des résultats conformes aux approches supervisées de pointe tout en nécessitant moins de ressources que d’autres méthodes non supervisées.

Séparation non supervisée de sources par inférence bayésienne dans le domaine latent | Articles de recherche récents | HyperAI