2ヶ月前
結合振動型再帰ニューラルネットワーク(coRNN):長時間依存関係を学習するための精度が高く、(勾配)安定したアーキテクチャ
T. Konstantin Rusch; Siddhartha Mishra

要約
生物学的なニューロン回路、例えば脳の機能部分は、結合振動子のネットワークとしてモデル化することができます。これらのシステムが豊富な出力セットを表現しつつ状態変数の勾配を制限する能力に着想を得て、私たちは新たなリカレントニューラルネットワーク(RNN)のアーキテクチャを提案します。提案するRNNは、制御された非線形振動子のネットワークをモデル化した二階常微分方程式系の時間離散化に基づいています。私たちは隠れ状態の勾配に関する精密な境界を証明し、これによりこのRNNにおける爆発的および消失的な勾配問題を軽減します。実験結果は、提案するRNNが様々なベンチマークにおいて最先端と同等の性能を示すことを示しており、このアーキテクチャが複雑な系列データ処理に安定かつ正確なRNNを提供する可能性があることを実証しています。