2 个月前

基于注意力机制的神经机器翻译的有效方法

Minh-Thang Luong; Hieu Pham; Christopher D. Manning
基于注意力机制的神经机器翻译的有效方法
摘要

近期,注意力机制被用于改进神经机器翻译(NMT),通过在翻译过程中有选择性地关注源句子的某些部分来提升性能。然而,关于适用于基于注意力机制的NMT的有效架构的研究相对较少。本文探讨了两类简单且有效的注意力机制:一种是全局方法,始终关注所有源词;另一种是局部方法,每次仅关注源词的一个子集。我们在这两种方法上展示了其在WMT英德双向翻译任务中的有效性。利用局部注意力机制,我们在已集成诸如dropout等已知技术的非注意力系统基础上实现了显著的5.0个BLEU分的提升。通过结合不同注意力架构的模型集合,我们在WMT'15英德翻译任务中取得了25.9个BLEU分的新最佳结果,比现有的最佳系统(该系统基于NMT和n-gram重排序器)提高了1.0个BLEU分。

基于注意力机制的神经机器翻译的有效方法 | 最新论文 | HyperAI超神经