HyperAI초신경

CCMT 2019-BSTC 음성 번역 코퍼스

날짜

3년 전

크기

4.51 GB

기관

바이두

발행 주소

ai.baidu.com

特色图像

BSTC는 Baidu Speech Translation Corpus의 약자로, 자동 동시 통역 시스템을 구축하는 데 사용되는 대규모 자동 동시 통역 데이터 세트입니다.

코퍼스는 훈련 세트, 개발 세트, 테스트 세트의 세 가지 하위 세트로 나뉩니다. 각 하위 집합에는 다음이 포함됩니다.

- baidu_XX.wav라는 사운드 신호 파일

- 각 사운드 신호에 대한 설명 정보를 포함하는 설명 파일, 각 문장은 JSON 포맷으로 인코딩됨

- 연설 및 보고서에 대한 자세한 설명을 포함한 보충 문서

CCMT_2019_BSTC.torrent
시딩 2다운로드 중 0완료됨 387총 다운로드 횟수 591
  • CCMT_2019_BSTC/
    • README.md
      1.14 KB
    • README.txt
      2.29 KB
      • data/
        • Train_sample.zip
          111.89 MB
        • development_data.zip
          248.54 MB
        • training_data.zip
          4.51 GB