HyperAIHyperAI

Command Palette

Search for a command to run...

CleanUNet 2: Ein hybrides Sprach-Rauschunterdrückungsmodell auf Wellenform und Spektrogramm

Zhifeng Kong Wei Ping Ambrish Dantrey Bryan Catanzaro

Zusammenfassung

In dieser Arbeit präsentieren wir CleanUNet 2, einen Sprachrauschunterdrückungsmodell, das die Vorteile von Wellenform- und Spektrogramm-Rauschunterdrückern vereint und somit das Beste aus beiden Welten erreicht. CleanUNet 2 basiert auf einem zweistufigen Rahmenwerk, das sich an etablierten Methoden der Sprachsynthese orientiert, die aus einem Wellenformmodell und einem Spektrogrammmodell bestehen. Insbesondere baut CleanUNet 2 auf CleanUNet auf, dem derzeit fortschrittlichsten Wellenform-Rauschunterdrückungsmodell, und steigert dessen Leistung weiterhin, indem es vorhergesagte Spektrogramme eines Spektrogramm-Rauschunterdrückungsmodells als Eingabe nutzt. Wir zeigen, dass CleanUNet 2 gegenüber früheren Ansätzen in Bezug auf verschiedene objektive und subjektive Bewertungskriterien überlegen ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
CleanUNet 2: Ein hybrides Sprach-Rauschunterdrückungsmodell auf Wellenform und Spektrogramm | Paper | HyperAI