Command Palette
Search for a command to run...
CCMT 2019-BSTC Sprachübersetzungskorpus
Date
Size
Publish URL

BSTC steht für Baidu Speech Translation Corpus, einen umfangreichen Datensatz zur automatischen Simultandolmetschung, der zum Aufbau automatischer Simultandolmetschsysteme verwendet wird.
Das Korpus ist in drei Teilmengen unterteilt: Trainingssatz, Entwicklungssatz und Testsatz. Jede Teilmenge umfasst:
-Tonsignaldatei mit dem Namen baidu_XX.wav
- Beschreibungsdatei, einschließlich Beschreibungsinformationen zu jedem Tonsignal. Jeder Satz ist im JSON-Format codiert
- Ergänzende Dokumentation, einschließlich detaillierter Beschreibungen von Reden und Berichten
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.