WMT 2015 French/English parallel texts 是用于训练翻译模型的法语/英语平行文本数据集,它拥有超过 2000 万条法语与英语句子。
本数据集由 Chris Callison-Burch 创建,他在抓取上百万个网页后通过一组简单的启发式算法将法语网址转换为英文网址,并默认这些文档之间互为译文。
该数据集由约翰·霍普金斯大学、爱丁堡大学和阿姆斯特丹大学于 2009 年联合发布。
2 做种
0 下载
1134 已完成
- WMT 2015 French-English parallel texts/README.md 1.15 KB
- WMT 2015 French-English parallel texts/README.txt 1.15 KB
- WMT 2015 French-English parallel texts/data/WMT 2015 FrenchEnglish parallel texts.zip 2.42 GB