SepIt: Ansatz zur Erreichung der Grenze der Ein-Kanal-Sprachtrennung

Wir präsentieren eine obere Schranke für die Aufgabe der Ein-Kanal-Sprachtrennung, die auf einer Annahme über die Natur kurzer Sprachsegmente basiert. Unter Verwendung dieser Schranke können wir zeigen, dass während die jüngsten Methoden bei einigen Sprechern erhebliche Fortschritte gemacht haben, es bei fünf und zehn Sprechern noch Verbesserungspotenzial gibt. Anschließend stellen wir ein tiefes neuronales Netzwerk, SepIt, vor, das die Schätzungen der verschiedenen Sprecher iterativ verbessert. Bei der Testzeit hat SepIt eine variable Anzahl von Iterationen pro Testbeispiel, basierend auf einem Kriterium der gegenseitigen Information, das aus unserer Analyse hervorgeht. In umfangreichen Experimenten übertreffen SepIt die besten bisher bekannten neuronalen Netze für 2, 3, 5 und 10 Sprecher.