HyperAIHyperAI

Command Palette

Search for a command to run...

Das IBM-Telefon-Sprecherkennungssystem für konversationelles Englisch aus dem Jahr 2015

George Saon Hong-Kwang J. Kuo Steven Rennie Michael Picheny

Zusammenfassung

Wir beschreiben die neuesten Verbesserungen des IBM-Systems zur erkennung von konversationsnahem Telefon-Sprechsprache auf Englisch. Einige der als nützlich erachteten Techniken sind: Maxout-Netze mit abgeschalteten Dropout-Raten; Netze mit einer sehr großen Anzahl von Ausgängen, die auf 2000 Stunden Daten trainiert wurden; gemeinsames Modellieren teilweise entfalteter rekurrenter Neuronaler Netze und Faltungsnetze durch Kombination der Flaschenhals- und Ausgabeschichten und erneutes Training des daraus resultierenden Modells; sowie schließlich eine fortschrittliche Rescoring von Sprachmodellen mit exponentiellen und neuronalen Netzwerken (neural network LMs). Diese Techniken führen zu einem Wortsfehlerrate von 8,0 % im Switchboard-Teil des Hub5-2000-Evaluierungstests, was 23 % besser ist als unser bisher bestveröffentlichtes Ergebnis.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp