HyperAIHyperAI

Command Palette

Search for a command to run...

Eine Untersuchung zur Integration von Mamba für die Sprachverbesserung

Rong Chao Wen-Huang Cheng Moreno La Quatra Sabato Marco Siniscalchi Chao-Han Huck Yang Szu-Wei Fu Yu Tsao

Zusammenfassung

Diese Arbeit zielt darauf ab, ein skalierbares Zustandsraummodell (State-Space Model, SSM), namens Mamba, für die Sprachverbesserung (Speech Enhancement, SE) zu untersuchen. Wir nutzen ein auf Mamba basierendes Regressionsmodell, um Sprachsignale zu charakterisieren, und bauen darauf ein SE-System auf, das als SEMamba bezeichnet wird. Die Eigenschaften von Mamba werden durch dessen Integration als zentrales Modell in sowohl grundlegenden als auch fortgeschrittenen SE-Systemen erforscht, wobei sowohl signalbasierte Abstandsmetriken als auch metrikorientierte Verlustfunktionen eingesetzt werden. SEMamba erzielt vielversprechende Ergebnisse und erreicht auf dem VoiceBank-DEMAND-Datensatz einen PESQ-Wert von 3,55. Bei Kombination mit der perceptiven Kontraststreckungstechnik wird ein neuer State-of-the-Art-PESQ-Wert von 3,69 erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Eine Untersuchung zur Integration von Mamba für die Sprachverbesserung | Paper | HyperAI