HyperAIHyperAI

Command Palette

Search for a command to run...

再帰的なバッチ正規化

Tim Cooijmans Nicolas Ballas César Laurent Çağlar Gülçehre Aaron Courville

概要

私たちは、LSTMの再パラメータ化を提案し、バッチ正規化の利点を再帰型ニューラルネットワークに持ち込むことを目指しています。従来の研究ではRNNの入力から隠れ層への変換にのみバッチ正規化が適用されていましたが、私たちは隠れ層から隠れ層への遷移にもバッチ正規化を適用することが可能であり有益であることを示しています。これにより、時間ステップ間での内部共変量シフト(internal covariate shift)を軽減することができます。我々はこの提案を、系列分類、言語モデル、質問応答など様々な逐次的な問題に対して評価しました。実験結果は、バッチ正規化されたLSTMが一貫して収束速度の向上と汎化性能の改善につながることを示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています