HyperAIHyperAI

Command Palette

Search for a command to run...

Espresso: Ein schnelles end-to-end neuronales Spracherkennungstoolkit

Yiming Wang Tongfei Chen Hainan Xu Shuoyang Ding Hang Lv Yiwen Shao Nanyun Peng Lei Xie Shinji Watanabe Sanjeev Khudanpur

Zusammenfassung

Wir präsentieren Espresso, ein quelloffenes, modulares und erweiterbares end-to-end-Neurales Automatisches Spracherkennungssystem (ASR), das auf der Deep-Learning-Bibliothek PyTorch und dem populären neuronalen Maschinübersetzungs-Toolkit fairseq basiert. Espresso unterstützt verteiltes Training über GPUs und Rechenknoten und verfügt über verschiedene Dekodieransätze, die in der ASR üblich sind, darunter die Vorwärts-Schau-Wort-basierte Sprachmodellfusion, für die ein schneller, paralleler Dekoder implementiert wurde. Espresso erreicht unter den end-to-end-Systemen Spitzenleistungen bei den Datensätzen WSJ, LibriSpeech und Switchboard – ohne Datenverstärkung – und ist bei der Dekodierung 4 bis 11 Mal schneller als vergleichbare Systeme (z. B. ESPnet).


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp