2ヶ月前

学習率なしで深層ネットワークを訓練するためのコインベッティング手法

Francesco Orabona; Tatiana Tommasi
学習率なしで深層ネットワークを訓練するためのコインベッティング手法
要約

深層学習手法は多くの応用シナリオで最先端の性能を達成しています。しかし、これらの手法は最良の結果を得るためには多大なハイパーパラメータ調整が必要です。特に、確率的最適化プロセスにおける学習率の調整は依然として主要なボトルネックの一つとなっています。本論文では、学習率設定を必要としない深層ネットワーク用の新しい確率的勾配降下法を提案します。従来の手法とは異なり、我々は学習率を適応させることも、目的関数の曲率を利用することもしません。代わりに、最適化プロセスをコイントス賭博に還元し、このシナリオ向けの学習率フリー最適アルゴリズムを提案します。理論的な収束性は凸関数および擬凸関数に対して証明されており、実験結果は我々のアルゴリズムが人気のある確率的勾配アルゴリズムよりも優れていることを示しています。

学習率なしで深層ネットワークを訓練するためのコインベッティング手法 | 最新論文 | HyperAI超神経