2 个月前

模型无关的元学习以实现深度网络的快速适应

Finn, Chelsea ; Abbeel, Pieter ; Levine, Sergey
模型无关的元学习以实现深度网络的快速适应
摘要

我们提出了一种模型无关的元学习算法,该算法与任何通过梯度下降训练的模型兼容,并适用于多种不同的学习问题,包括分类、回归和强化学习。元学习的目标是在各种学习任务上训练一个模型,使其能够仅使用少量训练样本解决新的学习任务。在我们的方法中,模型参数被显式地训练,以便当从新任务中获得少量训练数据时,只需进行少数几次梯度更新即可在该任务上取得良好的泛化性能。实际上,我们的方法旨在使模型易于微调。我们展示了这种方法在两个少样本图像分类基准测试中达到了最先进的性能,在少样本回归问题上也取得了良好效果,并且加速了使用神经网络策略的策略梯度强化学习的微调过程。

模型无关的元学习以实现深度网络的快速适应 | 最新论文 | HyperAI超神经