vor 6 Monaten

Zusammenfassung

Wir stellen eine neue Methode zur Trennung einer gemischten Audiodatei vor, bei der mehrere Stimmen gleichzeitig sprechen. Die neue Methode nutzt gatete neuronale Netze, die darauf trainiert sind, die Stimmen über mehrere Verarbeitungsschritte hinweg zu trennen, wobei die Sprecher in jeder Ausgabekanal festgehalten werden. Für jede mögliche Anzahl von Sprechern wird ein separates Modell trainiert, und das Modell mit der größten Anzahl von Sprechern wird verwendet, um die tatsächliche Anzahl von Sprechern in einer gegebenen Audiodatei zu bestimmen. Unsere Methode übertrifft die derzeitige State-of-the-Art-Technik erheblich, wie wir zeigen, wobei diese für mehr als zwei Sprecher nicht mehr wettbewerbsfähig ist.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Audio- Und Sprachverarbeitung

Eliya Nachmani Yossi Adi Lior Wolf

Zusammenfassung

Wir stellen eine neue Methode zur Trennung einer gemischten Audiodatei vor, bei der mehrere Stimmen gleichzeitig sprechen. Die neue Methode nutzt gatete neuronale Netze, die darauf trainiert sind, die Stimmen über mehrere Verarbeitungsschritte hinweg zu trennen, wobei die Sprecher in jeder Ausgabekanal festgehalten werden. Für jede mögliche Anzahl von Sprechern wird ein separates Modell trainiert, und das Modell mit der größten Anzahl von Sprechern wird verwendet, um die tatsächliche Anzahl von Sprechern in einer gegebenen Audiodatei zu bestimmen. Unsere Methode übertrifft die derzeitige State-of-the-Art-Technik erheblich, wie wir zeigen, wobei diese für mehr als zwei Sprecher nicht mehr wettbewerbsfähig ist.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Stimmtrennung mit einer unbekannten Anzahl mehrerer Sprecher

Eliya Nachmani Yossi Adi Lior Wolf

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Stimmtrennung mit einer unbekannten Anzahl mehrerer Sprecher

Eliya Nachmani Yossi Adi Lior Wolf

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Stimmtrennung mit einer unbekannten Anzahl mehrerer Sprecher

Eliya Nachmani Yossi Adi Lior Wolf

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters