HyperAI

Corpus De Traduction Vocale CCMT 2019-BSTC

Date

il y a 3 ans

Taille

4.51 GB

Organisation

Baidu

URL de publication

ai.baidu.com

特色图像

BSTC signifie Baidu Speech Translation Corpus, un ensemble de données d'interprétation simultanée automatique à grande échelle utilisé pour la construction de systèmes d'interprétation simultanée automatique.

Le corpus est divisé en trois sous-ensembles : ensemble d'entraînement, ensemble de développement et ensemble de test. Chaque sous-ensemble comprend :

-Fichier de signal sonore, nommé baidu_XX.wav

- Fichier de description, comprenant les informations de description de chaque signal sonore, chaque phrase est codée au format JSON

-Documentation complémentaire, comprenant des descriptions détaillées des discours et des rapports

CCMT_2019_BSTC.torrent
Partage 2Téléchargement 0Terminés 387Téléchargements totaux 591
  • CCMT_2019_BSTC/
    • README.md
      1.14 KB
    • README.txt
      2.29 KB
      • data/
        • Train_sample.zip
          111.89 MB
        • development_data.zip
          248.54 MB
        • training_data.zip
          4.51 GB