HyperAIHyperAI

Command Palette

Search for a command to run...

CCMT 2019-BSTC Sprachübersetzungskorpus

Featured Image

BSTC steht für Baidu Speech Translation Corpus, einen umfangreichen Datensatz zur automatischen Simultandolmetschung, der zum Aufbau automatischer Simultandolmetschsysteme verwendet wird.

Das Korpus ist in drei Teilmengen unterteilt: Trainingssatz, Entwicklungssatz und Testsatz. Jede Teilmenge umfasst:

-Tonsignaldatei mit dem Namen baidu_XX.wav

- Beschreibungsdatei, einschließlich Beschreibungsinformationen zu jedem Tonsignal. Jeder Satz ist im JSON-Format codiert

- Ergänzende Dokumentation, einschließlich detaillierter Beschreibungen von Reden und Berichten

CCMT_2019_BSTC.torrent
Seeding 2Downloading 0Completed 525Total Downloads 760
  • CCMT_2019_BSTC/
    • README.md
      1.14 KB
    • README.txt
      2.29 KB
      • data/
        • Train_sample.zip
          111.89 MB
        • development_data.zip
          248.54 MB
        • training_data.zip
          4.51 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp