HyperAI

CCMT 2019-BSTC Sprachübersetzungskorpus

Datum

vor 3 Jahren

Größe

4.51 GB

Organisation

Baidu

Veröffentlichungs-URL

ai.baidu.com

特色图像

BSTC steht für Baidu Speech Translation Corpus, einen umfangreichen Datensatz zur automatischen Simultandolmetschung, der zum Aufbau automatischer Simultandolmetschsysteme verwendet wird.

Das Korpus ist in drei Teilmengen unterteilt: Trainingssatz, Entwicklungssatz und Testsatz. Jede Teilmenge umfasst:

-Tonsignaldatei mit dem Namen baidu_XX.wav

- Beschreibungsdatei, einschließlich Beschreibungsinformationen zu jedem Tonsignal. Jeder Satz ist im JSON-Format codiert

- Ergänzende Dokumentation, einschließlich detaillierter Beschreibungen von Reden und Berichten

CCMT_2019_BSTC.torrent
Seeding 2Herunterladen 0Abgeschlossen 387Gesamtdownloads 591
  • CCMT_2019_BSTC/
    • README.md
      1.14 KB
    • README.txt
      2.29 KB
      • data/
        • Train_sample.zip
          111.89 MB
        • development_data.zip
          248.54 MB
        • training_data.zip
          4.51 GB