2ヶ月前

メタ曲率

Eunbyung Park; Junier B. Oliva
メタ曲率
要約

我々はメタ曲率(Meta-Curvature, MC)という枠組みを提案します。この枠組みは、より良い汎化性能と速いモデル適応のための曲率情報を学習することを目指しています。MCは、モデルに依存しないメタ学習者(Model-Agnostic Meta-Learner, MAML)を拡張し、内側の最適化において勾配を変換する方法を学習することで、変換された勾配が新しいタスクに対してより良い汎化性能を達成できるようにしています。大規模なニューラルネットワークの訓練のために、我々は曲率行列を一連のテンソル積によってモデルのパラメータ間の依存関係を捉える新しいスキームで小さな行列に分解しました。我々は提案手法の効果をいくつかの少ショット学習タスクとデータセットで示しました。特定のタスクに依存する技術やアーキテクチャを使用せずに、提案手法は以前のMAML変種よりも大幅な改善を達成し、最近の最先端手法よりも優れた性能を発揮しました。さらに、メタ訓練プロセスにおける収束速度が速まることも観察されました。最後に、メタ訓練された曲率によるより良い汎化性能について説明する分析を行いました。