HyperAIHyperAI
vor 15 Tagen

Unüberwachte Quellentrennung mittels Bayes'scher Inferenz im latente Domäne

Michele Mancusi, Emilian Postolache, Giorgio Mariani, Marco Fumero, Andrea Santilli, Luca Cosmo, Emanuele Rodolà
Unüberwachte Quellentrennung mittels Bayes'scher Inferenz im latente Domäne
Abstract

Stand der Technik basierende Audio-Quellentrennmodelle stützen sich auf überwachte, datengetriebene Ansätze, die in Bezug auf die Ressourcen für die Annotation kostspielig sein können. Andererseits sind Ansätze zur Trainingsdurchführung dieser Modelle ohne jegliche direkte Überwachung typischerweise hochgradig ressourcenintensiv hinsichtlich Speicherplatz und Rechenzeit und bleiben für den Einsatz im Inferenzzeitraum praktisch unbrauchbar. Wir zielen darauf ab, diese Einschränkungen zu überwinden, indem wir einen einfachen, jedoch effektiven unsupervisierten Trennalgorithmus vorschlagen, der direkt auf einer latenten Darstellung zeitdomänischer Signale operiert. Unser Algorithmus stützt sich auf tiefe bayessche Priorverteilungen in Form vortrainierter autoregressiver Netzwerke, um die Wahrscheinlichkeitsverteilungen jeder Quelle zu modellieren. Durch die geringe Kardinalität des diskreten latente Raums, der mit einem neuartigen Verlustterm trainiert wurde, der eine präzise arithmetische Struktur auf ihn aufprägt, gelingt es uns, exakte bayessche Inferenz durchzuführen, ohne auf Approximationsstrategien angewiesen zu sein. Wir validieren unseren Ansatz am Slakh-Datensatz (arXiv:1909.08494) und zeigen Ergebnisse, die mit denen führender überwachter Ansätze vergleichbar sind, wobei jedoch weniger Ressourcen im Vergleich zu anderen unsupervisierten Methoden benötigt werden.

Unüberwachte Quellentrennung mittels Bayes'scher Inferenz im latente Domäne | Neueste Forschungsarbeiten | HyperAI