HyperAIHyperAI

Command Palette

Search for a command to run...

Ein Modulationsbereichsverlust für neuronale Netzwerke zur Echtzeit-Sprachverbesserung

Tyler Vuong Yangyang Xia Richard M. Stern

Zusammenfassung

Wir beschreiben eine Modulationsdomänen-Verlustfunktion für tiefen Lern-basierte Sprachverbesserungssysteme. Lernbare spektro-temporale Reizfelder (STRFs) wurden angepasst, um eine Sprecheridentifikationsaufgabe zu optimieren. Die gelernten STRFs wurden anschließend verwendet, um einen gewichteten mittleren quadratischen Fehler (MSE) in der Modulationsdomäne zur Trainingsphase eines Sprachverbesserungssystems zu berechnen. Experimente zeigten, dass die Hinzufügung des Modulationsdomänen-MSE zum MSE in der spektro-temporalen Domäne die objektive Vorhersage von Sprachqualität und Verständlichkeit für Echtzeit-Sprachverbesserungssysteme erheblich verbesserte, ohne zusätzlichen Rechenaufwand während der Inferenz zu verursachen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp