日期
机构
发布地址
www.ldc.upenn.edu
标签
国外高校
社交
自然语言处理
分类
语音识别
Broadcast News 是用于下一个单词预测的大型文本数据集,其中包括 1996 年的广播新闻语音语料库包含来自 ABC,CNN 和 CSPAN 电视网以及 NPR 和 PRI 无线电网络的 104 小时广播,并附有相应的成绩单。
该系列是为 DARPA「HUB4」项目提供有关广播领域连续语音识别的培训数据。
该数据集由宾夕法尼亚大学于 1997 年发布,
相关论文:《1996 English Broadcast News Speech (HUB4) LDC97S44》