Broadcast News 大型文本数据集

日期

6 年前

机构

University of Pennsylvania

发布地址

www.ldc.upenn.edu

下载帮助

Broadcast News 是用于下一个单词预测的大型文本数据集,其中包括 1996 年的广播新闻语音语料库包含来自 ABC,CNN 和 CSPAN 电视网以及 NPR 和 PRI 无线电网络的 104 小时广播,并附有相应的成绩单。

该系列是为 DARPA「HUB4」项目提供有关广播领域连续语音识别的培训数据。

该数据集由宾夕法尼亚大学于 1997 年发布,

相关论文:《1996 English Broadcast News Speech (HUB4) LDC97S44》