HyperAIHyperAI

Command Palette

Search for a command to run...

Sprachrauschunterdrückung im Wellenformbereich mit Selbst-Attention

Zhifeng Kong Wei Ping Ambrish Dantrey Bryan Catanzaro

Zusammenfassung

In dieser Arbeit präsentieren wir CleanUNet, ein kausales Sprachentrauschungsmodell für Rohwellenformen. Das vorgeschlagene Modell basiert auf einer Encoder-Decoder-Architektur, die mehrere Self-Attention-Blöcke integriert, um die Darstellungen im Bottleneck zu verfeinern – ein entscheidender Faktor für hervorragende Ergebnisse. Das Modell wird durch eine Reihe von Verlustfunktionen optimiert, die sowohl auf der Wellenform als auch auf mehreren Spektralauflösungen definiert sind. Die vorgeschlagene Methode übertrifft die derzeitigen State-of-the-Art-Modelle hinsichtlich der Qualität der entrauschten Sprache, wie verschiedene objektive und subjektive Bewertungsmaße zeigen. Wir stellen unseren Code und die Modelle unter https://github.com/nvidia/cleanunet zur Verfügung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp