HyperAIHyperAI

Command Palette

Search for a command to run...

长短期记忆网络与动态跳过连接

Tao Gui; Qi Zhang; Lujun Zhao; Yaosong Lin; Minlong Peng; Jingjing Gong; Xuanjing Huang

摘要

近年来,长短时记忆网络(Long Short-Term Memory, LSTM)已成功应用于建模长度可变的序列数据。然而,LSTM在捕捉长距离依赖关系方面仍存在困难。在本研究中,我们通过引入动态跳过连接来缓解这一问题,该连接可以学习直接连接两个相关词汇。由于训练数据中没有依赖关系信息,我们提出了一种基于强化学习的新方法来建模依赖关系并连接相关词汇。所提出的模型根据跳过连接计算递归转换函数,这为总是按顺序处理整个句子的循环神经网络(Recurrent Neural Networks, RNNs)提供了动态跳过的优点。我们在三个自然语言处理任务上的实验结果表明,所提出的方法比现有方法具有更好的性能。在数字预测实验中,所提出的模型在准确性上比LSTM提高了近20%。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
长短期记忆网络与动态跳过连接 | 论文 | HyperAI超神经