HyperAIHyperAI

Command Palette

Search for a command to run...

Stimmtrennung mit einer unbekannten Anzahl mehrerer Sprecher

Eliya Nachmani Yossi Adi Lior Wolf

Zusammenfassung

Wir stellen eine neue Methode zur Trennung einer gemischten Audiodatei vor, bei der mehrere Stimmen gleichzeitig sprechen. Die neue Methode nutzt gatete neuronale Netze, die darauf trainiert sind, die Stimmen über mehrere Verarbeitungsschritte hinweg zu trennen, wobei die Sprecher in jeder Ausgabekanal festgehalten werden. Für jede mögliche Anzahl von Sprechern wird ein separates Modell trainiert, und das Modell mit der größten Anzahl von Sprechern wird verwendet, um die tatsächliche Anzahl von Sprechern in einer gegebenen Audiodatei zu bestimmen. Unsere Methode übertrifft die derzeitige State-of-the-Art-Technik erheblich, wie wir zeigen, wobei diese für mehr als zwei Sprecher nicht mehr wettbewerbsfähig ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Stimmtrennung mit einer unbekannten Anzahl mehrerer Sprecher | Paper | HyperAI