CCMT 2019-BSTC 音声翻訳コーパス

日期

3 年前

大小

4.51 GB

机构

百度

发布地址

ai.baidu.com

特色图像

BSTC は、Baidu Speech Translation Corpus の正式名称で、自動同時通訳システムの構築に使用される大規模な自動同時通訳データセットです。

コーパスは、トレーニング セット、開発セット、テスト セットの 3 つのサブセットに分かれています。各サブセットには次のものが含まれます。

-baidu_XX.wavという名前の音声信号ファイル

- 各音声信号の説明情報を含む説明ファイル。各ステートメントは JSON 形式でエンコードされます。

- スピーチやレポートの詳細なプレゼンテーションを含む補足文書

CCMT_2019_BSTC.torrent

做种 2

下载中 0

已完成 330

总下载 548

  • CCMT_2019_BSTC/
    • README.md
      1.14 KB
    • README.txt
      2.29 KB
      • data/
        • Train_sample.zip
          111.89 MB
        • development_data.zip
          248.54 MB
        • training_data.zip
          4.51 GB