WMT 2015 French/English parallel texts 法语/英语平行文本数据集

数据集下载 磁力链 下载帮助

OpenBayes 注册即获得免费算力

WMT 2015 French/English parallel texts 是用于训练翻译模型的法语/英语平行文本数据集,它拥有超过 2000 万条法语与英语句子。

本数据集由 Chris Callison-Burch 创建,他在抓取上百万个网页后通过一组简单的启发式算法将法语网址转换为英文网址,并默认这些文档之间互为译文。

该数据集由约翰·霍普金斯大学、爱丁堡大学和阿姆斯特丹大学于 2009 年联合发布。

1311 做种 10 下载 252 已完成
文件名大小
README.md1.15 KB
README.txt1.15 KB
WMT 2015 FrenchEnglish parallel texts.zip2.42 GB