2 个月前
使用RNN编码器-解码器学习短语表示以实现统计机器翻译
Kyunghyun Cho; Bart van Merrienboer; Caglar Gulcehre; Dzmitry Bahdanau; Fethi Bougares; Holger Schwenk; Yoshua Bengio

摘要
在本文中,我们提出了一种新颖的神经网络模型,称为RNN编码器-解码器(RNN Encoder-Decoder),该模型由两个循环神经网络(Recurrent Neural Networks, RNN)组成。其中一个RNN将符号序列编码为固定长度的向量表示,另一个RNN则将该向量表示解码为另一符号序列。所提出的模型的编码器和解码器联合训练,以最大化给定源序列的目标序列的条件概率。通过实验发现,利用RNN编码器-解码器计算的短语对的条件概率作为现有对数线性模型中的附加特征,统计机器翻译系统的性能得到了提升。从定性的角度来看,我们展示了所提出的模型能够学习到语言短语在语义和句法上的有意义表示。