HyperAIHyperAI

Command Palette

Search for a command to run...

Tiefe rekurrente Neuronale Netze für akustische Modellierung

William Chan Ian Lane

Zusammenfassung

Wir präsentieren ein neues tiefes rekurrentes Neuronales Netzwerk (RNN)-Modell für die akustische Modellierung im automatischen Spracherkennungssystem (ASR). Unser Beitrag wird als TC-DNN-BLSTM-DNN-Modell bezeichnet. Dieses Modell kombiniert ein tiefes neuronales Netzwerk (DNN) mit Zeitkonvolution (TC), gefolgt von einem bidirektionalen Langzeit-Short-Term-Memory-Netzwerk (BLSTM) und einem abschließenden DNN. Das erste DNN dient als Merkmalsprozessor für unser Modell, der BLSTM generiert anschließend einen Kontext aus dem sequenziellen akustischen Signal, und das finale DNN modelliert die posterioren Wahrscheinlichkeiten der akustischen Zustände. Wir erreichen eine Wortfehlerquote (WER) von 3,47 % bei der Wall Street Journal (WSJ) eval92-Aufgabe, was einem relativen Verbesserungsvon mehr als 8 % gegenüber den Baseline-DNN-Modellen entspricht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp