BSTC は、Baidu Speech Translation Corpus の正式名称で、自動同時通訳システムの構築に使用される大規模な自動同時通訳データセットです。
コーパスは、トレーニング セット、開発セット、テスト セットの 3 つのサブセットに分かれています。各サブセットには次のものが含まれます。
-baidu_XX.wavという名前の音声信号ファイル
- 各音声信号の説明情報を含む説明ファイル。各ステートメントは JSON 形式でエンコードされます。
- スピーチやレポートの詳細なプレゼンテーションを含む補足文書
做种 2
下载中 0
已完成 330
总下载 548