Command Palette
Search for a command to run...
動的スキップ接続を持つ長期短期記憶(LSTM)
動的スキップ接続を持つ長期短期記憶(LSTM)
Tao Gui; Qi Zhang; Lujun Zhao; Yaosong Lin; Minlong Peng; Jingjing Gong; Xuanjing Huang
概要
近年、可変長の系列データをモデル化するために、長期短期記憶(LSTM)が成功裏に使用されてきました。しかし、LSTMは依然として長期依存関係の捕捉に困難を経験することがあります。本研究では、この問題を緩和するために動的なスキップ接続を導入しました。このスキップ接続は、依存関係にある2つの単語を直接結びつけることを学習できます。訓練データには依存情報が含まれていないため、新たな強化学習に基づく手法を提案し、依存関係をモデル化して依存する単語を結びつける方法を開発しました。提案されたモデルは、スキップ接続に基づいて再帰遷移関数を計算します。これにより、常に全文を順次処理するRNNに対して動的なスキップの利点が得られます。3つの自然言語処理タスクにおける実験結果は、提案手法が既存手法よりも優れた性能を達成できることを示しています。数値予測実験においては、提案モデルがLSTMに対して精度で約20%上回る結果となりました。