HyperAIHyperAI

Command Palette

Search for a command to run...

CCMT 2019-BSTC 语音翻译语料库

Featured Image

BSTC 全称 Baidu Speech Translation Corpus,是一个大型自动同声传译数据集, 用于自动同声传译系统的构建。

该语料库分为训练集、开发集和测试集 3 个子集,每个子集包括:

-声音信号文件,命名为 baidu_XX.wav

-描述文件,包括每个声音信号的描述信息,每个语句由 JSON 格式编码

-补充文档,包括演讲和报告的详细介绍

CCMT_2019_BSTC.torrent
Seeding 2Downloading 0Completed 526Total Downloads 760
  • CCMT_2019_BSTC/
    • README.md
      1.14 KB
    • README.txt
      2.29 KB
      • data/
        • Train_sample.zip
          111.89 MB
        • development_data.zip
          248.54 MB
        • training_data.zip
          4.51 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供