1 Billion Word Language Model Benchmark R13 Output 基准语料库

数据集下载 磁力链 下载帮助

OpenBayes 注册即获得免费算力

1 Billion Word Language Model Benchmark R13 Output 是一套新的基准语料库,被用于衡量和统计语言建模进展,凭借近 10 亿字的培训数据,该基准测试可以快速评估新的语言建模技术,并将其与其他新技术相结合。

该数据集由康奈尔大学于 2013 年发布,主要发布人有 Ciprian Chelba、Tomas Mikolov、Mike Schuster、Qi Ge、Thorsten Brants、Phillipp Koehn 和 Tony Robinson。

文件名大小
README.md1.18 KB
README.txt1.18 KB
1-billion-word-language-modeling-benchmark-r13output.tar.gz1.67 GB