2 个月前

学习如何学习:使用元学习的自适应视觉导航

Mitchell Wortsman; Kiana Ehsani; Mohammad Rastegari; Ali Farhadi; Roozbeh Mottaghi
学习如何学习:使用元学习的自适应视觉导航
摘要

学习本质上是一个连续的过程。当人类学习新任务时,并没有明确的训练和推理阶段之分。在执行任务的过程中,我们不断学习和完善对任务的理解。我们在不同学习阶段所学的内容和学习方式各不相同。学会如何学习和适应是我们能够轻松应对新环境的关键属性。这与传统机器学习中的设置形成鲜明对比,在传统设置中,经过训练的模型在推理过程中是固定的。本文研究了在视觉导航背景下,同时在训练时间和测试时间进行“学会学习”的问题。导航的一个基本挑战是在未见过的场景中实现泛化。为此,我们提出了一种自适应视觉导航方法(Self-Adaptive Visual Navigation, SAVN),该方法能够在没有任何显式监督的情况下适应新环境。我们的解决方案是一种元强化学习方法,其中代理学会一种自我监督的交互损失函数,以促进有效的导航行为。我们在AI2-THOR框架下进行的实验表明,该方法在新颖场景中的视觉导航成功率和SPL(Success-weighted by Path Length)方面均取得了显著提升。我们的代码和数据可在以下链接获取:https://github.com/allenai/savn 。

学习如何学习:使用元学习的自适应视觉导航 | 论文 | HyperAI超神经