HyperAI
Command Palette
Search for a command to run...
面向深度网络快速适应的模型无关元学习
面向深度网络快速适应的模型无关元学习
Finn Chelsea Abbeel Pieter Levine Sergey
摘要
我们提出了一种模型无关的元学习算法,该算法适用于任何通过梯度下降训练的模型,并可应用于多种不同的学习任务,包括分类、回归以及强化学习。元学习的目标是,在多种学习任务上训练模型,使其能够仅用少量训练样本便解决新的学习任务。在我们的方法中,模型的参数被显式地训练,使得在新任务上仅需少量梯度更新步骤和少量训练数据,即可在该任务上实现良好的泛化性能。本质上,该方法旨在训练模型,使其更易于微调。实验表明,该方法在两个少样本图像分类基准测试中均达到了当前最优性能,在少样本回归任务中也取得了良好效果,并显著加速了基于神经网络策略的策略梯度强化学习的微调过程。