2 个月前

耦合振荡递归神经网络(coRNN):一种准确且(梯度)稳定的架构,用于学习长时间依赖性

T. Konstantin Rusch; Siddhartha Mishra
耦合振荡递归神经网络(coRNN):一种准确且(梯度)稳定的架构,用于学习长时间依赖性
摘要

生物神经元电路,如大脑的功能区域,可以建模为耦合振子网络。受这些系统在保持状态变量(及其梯度)有界的同时能够产生丰富输出的启发,我们提出了一种新的递归神经网络架构。所提出的递归神经网络基于二阶常微分方程系统的时域离散化,该系统用于建模受控非线性振子网络。我们证明了隐藏状态梯度的精确界限,从而缓解了这种递归神经网络中的梯度爆炸和梯度消失问题。实验结果表明,所提出的递归神经网络在多种基准测试中表现与现有最先进方法相当,展示了该架构在处理复杂序列数据时提供稳定且准确的递归神经网络的潜力。