CCMT 2019-BSTC 음성 번역 코퍼스

BSTC는 Baidu Speech Translation Corpus의 약자로, 자동 동시 통역 시스템을 구축하는 데 사용되는 대규모 자동 동시 통역 데이터 세트입니다.
코퍼스는 훈련 세트, 개발 세트, 테스트 세트의 세 가지 하위 세트로 나뉩니다. 각 하위 집합에는 다음이 포함됩니다.
- baidu_XX.wav라는 사운드 신호 파일
- 각 사운드 신호에 대한 설명 정보를 포함하는 설명 파일, 각 문장은 JSON 포맷으로 인코딩됨
- 연설 및 보고서에 대한 자세한 설명을 포함한 보충 문서
CCMT_2019_BSTC.torrent
시딩 2다운로드 중 0완료됨 387총 다운로드 횟수 591