CCMT 2019-BSTC Sprachübersetzungskorpus
Datum
vor 3 Jahren
Größe
4.51 GB
Veröffentlichungs-URL
Tags
Kategorien

BSTC steht für Baidu Speech Translation Corpus, einen umfangreichen Datensatz zur automatischen Simultandolmetschung, der zum Aufbau automatischer Simultandolmetschsysteme verwendet wird.
Das Korpus ist in drei Teilmengen unterteilt: Trainingssatz, Entwicklungssatz und Testsatz. Jede Teilmenge umfasst:
-Tonsignaldatei mit dem Namen baidu_XX.wav
- Beschreibungsdatei, einschließlich Beschreibungsinformationen zu jedem Tonsignal. Jeder Satz ist im JSON-Format codiert
- Ergänzende Dokumentation, einschließlich detaillierter Beschreibungen von Reden und Berichten
CCMT_2019_BSTC.torrent
Seeding 2Herunterladen 0Abgeschlossen 387Gesamtdownloads 591