
要約
本論文では、タスクの分布が存在し、この分布からサンプリングされた未見のタスクに対して迅速に学習(つまり、良好なパフォーマンスを発揮)できるエージェントを獲得するメタ学習問題を取り扱います。私たちは、新しいタスクに対して迅速に微調整できるパラメータ初期化を学習するアルゴリズム群を分析します。これらのメタ学習更新には一階微分のみを使用します。このアルゴリズム群には、二階微分を無視することで得られるMAMLの近似である一階MAML(First-Order MAML)が含まれており、一般化されています。また、ここでは新たに提案するReptileアルゴリズムも含まれています。Reptileは、タスクを繰り返しサンプリングし、その上で訓練を行い、初期化パラメータを訓練済みの重み方向へ移動させる方法で動作します。私たちはFinnらの結果を拡張し、一階メタ学習アルゴリズムが少ショット分類のいくつかの既存ベンチマークで良好な性能を示すことを示しています。さらに、これらのアルゴリズムがなぜ効果的なのかを理解するために理論的な解析も提供しています。