2 个月前

利用单语数据改进神经机器翻译模型

Rico Sennrich; Barry Haddow; Alexandra Birch
利用单语数据改进神经机器翻译模型
摘要

神经机器翻译(NMT)在多种语言对上取得了最先进的性能,而仅使用平行数据进行训练。目标端单语数据在提高基于短语的统计机器翻译的流畅性方面起着重要作用,我们研究了单语数据在神经机器翻译中的应用。与之前的工作不同,这些工作将NMT模型与单独训练的语言模型结合,我们注意到编码器-解码器NMT架构已经具备学习与语言模型相同信息的能力,因此我们探索了在不改变神经网络架构的情况下利用单语数据进行训练的策略。通过将单语训练数据与其自动回译结果配对,我们可以将其视为额外的平行训练数据,并在WMT 15英德双向翻译任务中获得了显著改进(+2.8至3.7 BLEU分),以及在资源较少的IWSLT 14土耳其语到英语翻译任务中也取得了显著提升(+2.1至3.4 BLEU分),从而获得了新的最先进成果。此外,我们还展示了在特定领域内的单语和平行数据上进行微调可以为IWSLT 15英德翻译任务带来显著改进。